← Sugata
Тестирование поиска на Sugata
Напомню, мы начали использовать Manticore Search пару дней назад. Manticore Search родился в 2017 году как продолжение Sphinx Search (начало в 2001 году). Большую часть времени ушло на ознакомления с документацией. Дело в том, что Manticore Search может решать одну задачу разными подходами (как и InstantCMS), что с одной стороны открывает огромные возможности, а с другой, слегка усложняет выбор: как лучше сделать.
В общем, основная задача заключается в том, чтобы подружить интерфейс и организовать выборку по 4 независимым индексам (которые строятся в реальном времени).
На данный момент поиск полностью доступен со странице каталога. После «обкатки» он будет перенесен везде.
Не хочу писать много технических деталей, т.к. задача поста не в этом, а в цели сообщить, что поиск можно тестировать. Он поддерживает синонимы, морфологию, подсказки и т.д.
Работы еще много, но каркас сделан. Пробуем.
Предыдущий пост: Manticore Search в InstantCMS
P.S. база очень мала, поэтому попробуйте набрать что-то простое.
Отображаемое время поиска пришлось обмануть в плюс, и показать не фактическое время, а увеличенное. Настоящее время показывается с большим количеством нулей после запятой, мало данный.
Перейти в каталог: https://sugata.ru/web
Уже сил нет тестировать его.
Дааа, ) а еще в порядок все это дело надо приводить. Кода много.
Вы bash скриптом делаете управление? searchd --stop, indexer --all, searchd...
Да, только при переиндексации индексатор сам отправляет демону Manticore HUP сигнал об изменении. Я не знаю, как везде, но тут не надо перестраивать и перезапускать searchd. И это мы говорим про «простые индексы», на диске. Т.е. самые, самые «примитивные». RealTime (rt), например, пока не смотрел. Т.е. тут все достаточно просто, лишь надо было разобраться с перекрестными индексами, так я их называю, и поиску по 4 индексам за раз.
А как тут можно подкручивать ранжирование?
Мы можем по секциям задать веса, разные типы ранжирования, там в документации много чего есть. А можно банально вообще переопределять запросы. Выводить то, что надо на первое место. Это противоречит конечно «духу» поисковых систем. Но тут и не поисковая система, значит все норм.
Готов первый макет поиска. Достаточно набрать что-то в шапке, и сразу мы будем там. Возможно придется обновить кэш (контрл+f5) или как-то так. Это то, с чем можно работать. Написать css с нуля. Весь файл < 5 кб.
Хорошо,.вот от этого и буду отталкиваться. Сколько не смотрю, C++ мощно конечно.
Тут даже не то что мощно, Java «мощна» аналогично, но меня настораживает расход памяти. Боюсь соврать, сколько гиг надо, чтобы искало одновременно N людей, но забирает серьезно. Прошлый разработчик Nutch говорил мол, железо дешевое, покупайте, и это так, но, черт знает. Настораживает как-то. На адре искало (max) 200 человек за раз практически выходило, гигов 8, вроде. Мы рассчитывали на 10 мл. посещаемость в сутки и в пике 1000 запросов. Выходило что-то накладно. Но это когда было. Тогда и железо дорогое было. Че говорить проц. 800МГ. мощный был.