Использование массового многоязычного распознавания именованных объектов для более инклюзивного НЛП
Борах Джансема, инженер по машинному обучению в Slimmer AI, недавно опубликовал статью в Towards Data Science под названием Раскрытие возможностей инклюзивности с помощью Polyglot-NER, в которой он рассказывает о проблемы, возникающие при использовании распознавания именованных объектов в наборах данных, отличных от английского.
Английское предубеждение, преобладающее в NER, фактически исключает значительную часть мира из этого важного технологического прогресса.
В этой статье Борах исследует важность моделей полиглотов и подробно описывает конкретные модели. В последующих постах он планирует сосредоточиться на тестах и результатах.
Подпишитесь на нас в LinkedIn и Twitter, чтобы узнать больше подобных историй.