Great work but needs tuning
Отличная работа, спасибо что поделились.
Маленький коммент, в коде функция multilabel предполагает, что она делает multilabel, когда на самом деле она выбирает один класс с максимальным значением np.argmax(y_c), то есть делает multiclass.
Я попробовал модель на ~10,000 отзывов для эксперимента, и даже установив порог в 95% уверенности, часто получал не те результаты которые ожидал.
Например слова «бомба» и «пушка» в смысле «круто» понимает как угрозу оружием:
[["weapons", 0.989, "- - - " Мои дети ходили на квест ШКОЛА - безумно понравилось. Сказали, что это пушка, петарда
Масульманские имена за терроризм
[["terrorism", 0.961, "- - - Очень хорошая работа актёров Ислама и Севы. И очень подробный инструктаж перед началом."]]
Упоминание небес или бога как проблемы по религиозной части
[["religion", 0.956, "- - - ПОТРЯСАЮЩЕ! У меня восторг до небес, администраторы очень милые и харизматичные, актеры очень энергичные и эмоциональные. Я ПРОСТО В ВОСТОРГЕ. ОЧЕНЬ СТРАШНО БЫЛО. ПРИКОСНОВЕНИЯ УМЕРЕННЫЕ И ШОКИРУЮЩИЕ. Очень интересное оформление и подходит персонажам. По сюжету все шикарно подходит. Были индив"]]
Иногда просто ошибается
[["religion", 0.959, "- - - Страшный, я испугалс"]]
Мои отзывы бывали больше окна в 512 токенов. Чанковал с небольшим перекрытием.
Большая вероятность, что причина в моем коде, а не вашей хорошей модели. Были ли у вас подобные результаты? Спасибо.

