ElasticCTR
ElasticCTR — это решение для распределённого обучения и прогнозирования CTR, которое можно развернуть в один клик. Пользователю нужно только настроить источник данных и формат образца.
Проект предлагает комплексное решение для обучения и разработки CTR. Основные особенности:
Пользователи могут легко расширить ElasticCTR до других сред Kubernetes.
Перед запуском ElasticCTR необходимо настроить кластер Kubernetes и установить компонент Volcano. Для развёртывания на платформе Baidu CCE достаточно подать заявку. Также ElasticCTR поддерживает другие облачные платформы.
После настройки кластера необходимо подготовить HDFS в качестве источника данных.
Для развёртывания можно использовать скрипт elastic-control.sh. Перед его запуском убедитесь, что на компьютере установлен Python 3 и пакет mlflow (устанавливается командой python3 -m pip install mlflow -i https://pypi.tuna.tsinghua.edu.cn/simple).
Скрипт используется следующим образом:
bash elastic-control.sh [COMMAND] [OPTIONS]
Возможные команды:
При определении конфигурации обучения можно добавить дополнительные параметры для указания ресурсов:
Формат данных должен соответствовать примеру:
$show $click $feasign0:$slot0 $feasign1:$slot1 $feasign2:$slot2......
Пример:
1 0 17241709254077376921:0 132683728328325035:1 9179429492816205016:2 12045056225382541705:3
Файл data.config содержит следующие переменные:
export HDFS_ADDRESS="hdfs://${IP}:9000" # HDFS адрес
export HDFS_UGI="root,i" # имя пользователя и пароль HDFS
export START_DATE_HR=20200401/00 # время начала тренировочного набора, представляет 2020-04-01 00:00
export END_DATE_HR=20200401/03 # время окончания тренировочного набора, представляет 2020-04-01 03:00
export DATASET_PATH="/train_data" # префикс тренировочного набора в HDFS
export SPARSE_DIM="1000001" # размер разреженного параметра, можно не указывать
Примеры использования скрипта:
bash elastic-control.sh -r -u 4 -m 20 -t 2 -p 2 -b 5 -s slot.conf -f data.config
bash elastic-control.sh -a
bash elastic-control.sh -l
bash elastic-control.sh -c
Мы предлагаем два способа отслеживания прогресса обучения:
bash elastic-control.sh -l
bash elastic-control.sh -l
Когда модель будет готова к использованию, можно выполнить прогнозирование. Для этого введите следующую команду:
bash elastic-control.sh -c
Следуйте инструкциям на экране для выполнения прогнозирования. Результаты будут выведены в стандартном выводе.
You can comment after Login
Inappropriate content may be displayed here and will not be shown on the page. You can check and modify it through the relevant editing function
If you confirm that the content does not involve inappropriate language/advertisement redirection/violence/vulgar pornography/infringement/piracy/false/insignificant or illegal content related to national laws and regulations, you can click submit to make an appeal, and we will handle it as soon as possible.
Comments ( 0 )