Great work but needs tuning

#3
by Garintheengineer - opened
This comment has been hidden (marked as Resolved)
Garintheengineer changed discussion title from Not multilabel but multiclass to Great work
Garintheengineer changed discussion status to closed
Garintheengineer changed discussion status to open
Garintheengineer changed discussion title from Great work to Great work but needs tuning

Отличная работа, спасибо что поделились.

Маленький коммент, в коде функция multilabel предполагает, что она делает multilabel, когда на самом деле она выбирает один класс с максимальным значением np.argmax(y_c), то есть делает multiclass.

Я попробовал модель на ~10,000 отзывов для эксперимента, и даже установив порог в 95% уверенности, часто получал не те результаты которые ожидал.

Например слова «бомба» и «пушка» в смысле «круто» понимает как угрозу оружием:
[["weapons", 0.989, "- - - " Мои дети ходили на квест ШКОЛА - безумно понравилось. Сказали, что это пушка, петарда

Масульманские имена за терроризм
[["terrorism", 0.961, "- - - Очень хорошая работа актёров Ислама и Севы. И очень подробный инструктаж перед началом."]]

Упоминание небес или бога как проблемы по религиозной части
[["religion", 0.956, "- - - ПОТРЯСАЮЩЕ! У меня восторг до небес, администраторы очень милые и харизматичные, актеры очень энергичные и эмоциональные. Я ПРОСТО В ВОСТОРГЕ. ОЧЕНЬ СТРАШНО БЫЛО. ПРИКОСНОВЕНИЯ УМЕРЕННЫЕ И ШОКИРУЮЩИЕ. Очень интересное оформление и подходит персонажам. По сюжету все шикарно подходит. Были индив"]]

Иногда просто ошибается
[["religion", 0.959, "- - - Страшный, я испугалс"]]

Мои отзывы бывали больше окна в 512 токенов. Чанковал с небольшим перекрытием.

Большая вероятность, что причина в моем коде, а не вашей хорошей модели. Были ли у вас подобные результаты? Спасибо.

image

image

Sign up or log in to comment