Are you sure you want to delete this access key?
Запуск из терминала python3 ./manual_labeling.py
Для разметки в скрипте нужно выбрать количество размечающих (LABELER_COUNT
) и номер размечающего (LABELER_ID
, от 0 до LABELER_COUNT - 1
), чтобы в размеченных данных не было пересечений.
Размеченные данные сохраняются в файл data_parts/labeled_comments_partition{id}.npy
, где {id}
--- номер размечающего.
Если комментарий хороший, то нужно нажимать y
. Иначе, n
. По остальным нажатиям сессия разметки завершается. Слишком длинные комментарии пропускаются.
Запуск из терминала python3 ./make_train.py
По разметке, собранной из данных в папке data_parts
, определяется, для каких комментариев известна целевая переменная. Затем из этих комментариев извлекаются параметры.
Результат сохраняется в файл train.csv
Запуск из терминала python3 ./train_model.py
Обучает модель по заданным размеченным данным и сохраняет её в заданную папку. Необходимо задать несколько глобальных значений:
Запуск из терминала python3 ./update_notebook.py
Выгружает сохраненную модель и на основе полученных от неё предсказаний удаляет комментарии из поданных данных. Необходимо задать несколько глобальных значений:
Press p or to see the previous file or, n or to see the next file
Are you sure you want to delete this access key?
Are you sure you want to delete this access key?
Are you sure you want to delete this access key?
Are you sure you want to delete this access key?