Публикации по теме 'information-retrieval'


Регуляризация FLOP: изучение разреженных вложений
Помимо популярного поиска информации на основе «плотного векторного представления», еще одним популярным способом поиска информации является встраивание на основе нейронной сети и поиск на основе «словарного представления». При поиске на основе лексикона входной запрос и документы представляются с использованием разреженного вектора размером с число лексиконов [2] . Для большинства токенизаторов количество словарей исчисляется десятками тысяч. (Например, bert-base-uncased-vocab.txt..