Я не уверен, что понимаю, как модель векторного пространства используется в оценке люцена.
Я читал здесь (https://www.elastic.co/guide/en/elasticsearch/guide/current/practical-scoring-function.html), что lucene оценивает документ как сумму tf-idf каждого запроса термина (если мы опускаем коэффициент координации, поле длина и бусты). Я не понимаю, как используется модель векторного пространства.
Модель пространственного вектора может использоваться для вычисления сходства между вектором tf-idf документа и вектором tf-idf запроса. Это должно дать нам оценку CosSimilarity между запросом и документом. Оценка будет между 0 и 1, поэтому разные запросы будет легко сравнивать.
Почему бы не использовать счет люцена?