Показать сообщение отдельно
Старый 06.03.2002, 23:20
Crazy вне форума Посмотреть профиль Отправить личное сообщение для Crazy Посетить домашнюю страницу Crazy Найти все сообщения от Crazy
  № 6  
Crazy
 
Аватар для Crazy

Регистрация: Dec 2001
Сообщений: 4,159
Простейший вариант таков:

1. Помимо списка слов заводим список производных слов (два поля: id базового слова и текст слова). В список слов, упомянутый ранее, заносим только базовые формы.

2. При поиске и индексировании мы сначала проверяем, не является ли это слово производным и только потом -- при отрицательном результате -- ищем в базовом списке.

Все новые слова на автомате регистрируются как базовые. Время от времени вручную или с использованием словарей производим вычистку списка базовых слов.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++