
06.03.2002, 23:20
|
|
Регистрация: Dec 2001
Сообщений: 4,159
|
Простейший вариант таков:
1. Помимо списка слов заводим список производных слов (два поля: id базового слова и текст слова). В список слов, упомянутый ранее, заносим только базовые формы.
2. При поиске и индексировании мы сначала проверяем, не является ли это слово производным и только потом -- при отрицательном результате -- ищем в базовом списке.
Все новые слова на автомате регистрируются как базовые. Время от времени вручную или с использованием словарей производим вычистку списка базовых слов.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++
|