Использование массового многоязычного распознавания именованных объектов для более инклюзивного НЛП

Борах Джансема, инженер по машинному обучению в Slimmer AI, недавно опубликовал статью в Towards Data Science под названием Раскрытие возможностей инклюзивности с помощью Polyglot-NER, в которой он рассказывает о проблемы, возникающие при использовании распознавания именованных объектов в наборах данных, отличных от английского.

Английское предубеждение, преобладающее в NER, фактически исключает значительную часть мира из этого важного технологического прогресса.

В этой статье Борах исследует важность моделей полиглотов и подробно описывает конкретные модели. В последующих постах он планирует сосредоточиться на тестах и ​​результатах.

Подпишитесь на нас в LinkedIn и Twitter, чтобы узнать больше подобных историй.