извличане само на думите от голям текстов файл?

naskobg

Well-Known Member
някой да знае програма която да може да разпознава/извлича само думите от текстов файл който е пълен с много други знаци като !@#$%^&*() и подобни.?Имам един файл 18 мб txt и искам да знам дали вътре има думи..Някой да знае как става това?

блг. предварително
 
От: извличане само на думите от голям текстов файл?

Може да си свалиш regexbuddy. Разбира се ще се нуждаеш и поне от основни познания по Регулярни Изрази. Там ще можеш да кажеш нещо от рода -> дай ми всички знаци, които не са следните...

Тук има и уроци за Регулярни Изрази.

regular-expressions.info
 
От: извличане само на думите от голям текстов файл?

Ако имаш VPS или някакъв достъп до Linux - там имаше една команда strings ако не се лъжа.
Пишеш strings filename.txt и ти вади само думите от файла.
 
От: извличане само на думите от голям текстов файл?

благодаря но е сложничко..и да чета тепърва Регулярни Изрази,за сега ме мързи.все пак благодаря,
нещо по лесно като програма?
Може да си свалиш regexbuddy. Разбира се ще се нуждаеш и поне от основни познания по Регулярни Изрази. Там ще можеш да кажеш нещо от рода -> дай ми всички знаци, които не са следните...

Тук има и уроци за Регулярни Изрази.

regular-expressions.info
 
От: извличане само на думите от голям текстов файл?

и това без значение какви други символи има в тхт файла?
Ако имаш VPS или някакъв достъп до Linux - там имаше една команда strings ако не се лъжа.
Пишеш strings filename.txt и ти вади само думите от файла.
 
От: извличане само на думите от голям текстов файл?

и това без значение какви други символи има в тхт файла?

Май да, идеята беше да извлича текстове от бинарни файлове, ама най-добре пробвай как ще се държи в тоя случай.
 
От: извличане само на думите от голям текстов файл?

Код:
grep -l dumata `find directory/* -name '*.txt' -print`
Това търси определена дума във всички txt файлове в зададената директория, може да се промени да търси само в един файл като му напишеш цялото име.
 
От: извличане само на думите от голям текстов файл?

Ако търсиш определена дума е хиляди файлове или е много голям файл използвай Notepad ++
на търсене последната опция е Find in Files

изобщо не ти трябва Линукс или ВПС или каквото да било друго
Аз така използвайки Notepad ++ съм превеждал цели сайтове съдържащи хиляди файлове търся нещото и го превеждам
аре успех
 
От: извличане само на думите от голям текстов файл?

не е за определена дума..а за всички думи..само думите да екстрактва от файл където има числа..%^&*() и подобни символи.
Ако търсиш определена дума е хиляди файлове или е много голям файл използвай Notepad ++
на търсене последната опция е Find in Files

изобщо не ти трябва Линукс или ВПС или каквото да било друго
Аз така използвайки Notepad ++ съм превеждал цели сайтове съдържащи хиляди файлове търся нещото и го превеждам
аре успех
 
От: извличане само на думите от голям текстов файл?

Програма не знам, но с подръчни средства може да излезе нещо ... прати ми файла и ще ти го върна освободен от символи ако успея ;)
 

Горе