Cursor ускоряет regex-поиск для AI-агентов: индексы вместо долгого ripgrep

Агенты любят grep. Семантические индексы помогают во многих задачах, но часть запросов можно выполнить только через поиск по регулярным выражениям — и в крупных монорепозиториях ripgrep может упираться в 15 секунд и больше.
Cursor рассказывает, как они строят индексы для regex-поиска: инвертированные индексы, триграммная декомпозиция, суффиксные массивы и умный выбор n-грамм. Идея — заранее проиндексировать текст, чтобы агент не сканировал миллионы строк с нуля при каждом запросе.
Подробности подхода и технические детали — в блоге Cursor.