|
|
|
Есть необходимость вот такого интересного удаления дублирующихся слов ( не строк).
Большинство программ ( keywordkeeper, penguin, keywash и многие другие)- удаляют только дубли строк.
А ситуация такая:
например есть строки:
зеленый огурец
зеленый луг
зеленый лес
человек в капюшоне
лис в капюшоне с головой
лис в капюшоне с рогами
если запустить через обычные программы, то ничего не удалится, а в моем случае надо удалить повторяющиеся слова, оставив конечно первое.
то есть чтобы на выходе было
зеленый огурец
луг
лес
лис в капюшоне с головой
с рогами
То есть каждое слово в итоге должно лишь раз встречаться в файле ( а дубли именно слов удалены)
Буду очень признателен если подскажете, какая программа может такое делать?
Или может в какой-либо существующей программе можно задать как-то по хитрому правило для этого? |
|
|
|
|
|
На php можно сделать такой скрипт в несколько строк. Сначала он, к примеру, запихивает все уникальные слова в массив, потом этим массивом проходит по файлу и оставляет только строки с вхождение каждого слова из массива, остальные удаляет. Короче, вам к php программисту с четком поставленным ТЗ, что вы от него хотите. Php скрипты можно же не только на хостинге пускать, а даже на локальной машине при помощи Денвера, например. |
|
|
|
|
|
Почему именно php? На любом языке это делается на легке. |
|
|
|
|
|
|
|
|