поисковая система

Здравствуйте, помогите пожалуйста с проблеммой.
Мне нужно (достаточно часто) искать файлы по их содержимому, реч идёт о файлах *.doc и *.xls . Подскажите пожалуйста чем это можно сделать, раньше я пользовался локальным поиском яндекса, но ттеперь проект закрыли.
Подскажите софтину, которая может индексировать содержимое файлов и использовать его в поиске. Желательно с графическим интерфейсом. ну и ссылочку для скачивания, если не затруднит.

Спасибо

+2
Youpiter - 3 Сентябрь, 2012 - 15:55
Изображение пользователя Youpiter.

Как бы в кубунту должно работать искаропки. Нажмите в дельфине Ctrl+F, например.

0
vasiliy_tver - 4 Сентябрь, 2012 - 08:56

в том то и дело что поиск по имени и по содержимому даёт одинаковый результат, т.е. выдаёт файлы в названии которых есть искомое слово. А мне нужно чтобы файлы находились именно по содержимому, чтобы искомое слово или сочетание встречалось именно в тексте файла а не в его названии

+1
DarkneSS - 3 Сентябрь, 2012 - 16:10
Изображение пользователя DarkneSS.

Знаю только krusader

0
vasiliy_tver - 4 Сентябрь, 2012 - 09:15

поставил посмотрел, немного не то. если поиск в документах *.doc проходит нормально, то в *.xls ничего не ищется. а нужно именно *.xls

0
DarkneSS - 4 Сентябрь, 2012 - 09:53
Изображение пользователя DarkneSS.

Понимаю. Не ожидал, что он и доки умеет, если честно. Не знаю, что вам посоветовать. Говорят, что Nepomuk/Strigi (базовый компонент КДЕ) это умеет. Вот обзор в тему. И ещё.

0
vasiliy_tver - 4 Сентябрь, 2012 - 14:41

спасибо, буду пробовать

0
Ronaldvin - 7 Сентябрь, 2012 - 19:39

юзай grep

+1
Xenomorph - 7 Сентябрь, 2012 - 20:07
Изображение пользователя Xenomorph.

Сам-то пробовал?

0
Ronaldvin - 8 Сентябрь, 2012 - 15:28

постоянно его использую, а что?

+1
Xenomorph - 9 Сентябрь, 2012 - 15:40
Изображение пользователя Xenomorph.

Что у тебя за grep такой, что в бинарных файлах ищет текстовые данные?

0
DarkneSS - 9 Сентябрь, 2012 - 21:15
Изображение пользователя DarkneSS.

В комбинации с анзипом (*.???x) вполне ;)

0
vasiliy_tver - 10 Сентябрь, 2012 - 11:24

что-то у меня не получается его запустить. У него есть графический интерфейс или только через консоль юзать можно. это я про grep

0
Youpiter - 10 Сентябрь, 2012 - 12:05
Изображение пользователя Youpiter.

Это консольная команда, выглядит примерно так
grep -rln 'текст' ~/Документы/
Но если документов очень много, то процесс поиска может, мягко говоря, затянуться. Поэтому лучше использовать вместе с командой find в качестве фильтра, напрмер
find . -name "*.txt"| grep -rln 'текст' ~/Документы/

Но это совсем не индексация файлов. И в файлах .xls она не ищет. Поэтому совет про grep считаю бесполезным.

0
vasiliy_tver - 10 Сентябрь, 2012 - 10:33

поставил recoll в текстовых файлах ищет, в электронных таблицах тоже, но есть единственный минус, индекс не обновляется, т.е. как после более или менее серьёзных изменений файлов приходится перестраивать индексную базу вручную. Это не совсем удобно, но за неимением лучшего пойдёт и так. Как говорится: "На безрыбье и таракан - мясо"

0
Youpiter - 10 Сентябрь, 2012 - 10:48
Изображение пользователя Youpiter.

Может быть тогда лучше поставить автоматический запуск индексации каждый час через cron
0 * * * recollindex

0
vasiliy_tver - 11 Сентябрь, 2012 - 13:52

с индексацией есть ещё одна заморочка. Комп не совсем новый и как следствие совсем неторопливый, поэтому при индексации процессор загружается на 50-75 %.
Я тут подумал что можно вручную запускать индексацию раз в неделю и тогда всё будет замечательно.

0
dyug - 11 Сентябрь, 2012 - 14:30

но можно и по крону раз в час, как написано выше, или раз в день, раз в неделю, раз в месяц, раз в мане по крону есть много рецептов запуска. :-)
хотелось бы уточнить, что в кроне или пользовательская запись, или с указанием юзера.
Подробности есть в мане :-)

+2
Youpiter - 11 Сентябрь, 2012 - 20:18
Изображение пользователя Youpiter.

Хотелось бы добавить, что если не хочется разбираться с консолью или с этим есть какие то трудности, можно доустановить из репозитория утилиту kcron. После этого в "Параметрах системы", появится пункт "Панировщик заданий" где наглядно и без особого труда настраивается cron под свои нужды.

+1
Youpiter - 11 Сентябрь, 2012 - 21:35
Изображение пользователя Youpiter.

Я вот тут подумал, если компьютер не очень мощный и индексация отъедает заметно ресурсы, может быть есть смысл запускать индексацию с низким приоритетом (читаем man nice)
Или же, автоматически запускать индексацию в момент простоя более 10 минут, например. Настраивается в "Параметрах системы" -> "Управление питанием".

0
vasiliy_tver - 13 Сентябрь, 2012 - 11:01

Спасибо, вроде работает

0
SD - 11 Сентябрь, 2012 - 07:52

Есть кросс-платформенная программка DocFetcher
Скачать и распаковать куда угодно (можно в домашнюю). Для запуска DocFetcher.sh (проверить, чтобы был исполняемым).

Отправить комментарий

CAPTCHA на основе изображений
Введите цифры