Как выделить русские слова?
Люди, а как выделить русские слова из текста?
Например, я получаю html файл вот таким образом: use LWP::UserAgent; $ua = LWP::UserAgent->new; $url="http://aport.ru"; my $req = HTTP::Request->new(GET=>$url); #указываем тип контекста #$req->content_type('application/x-www-form-urlencoded'); #вводим сам контекст для передачи $req->content(""); my $res = $ua->request($req); $doc=$res->content; дальше... print "<br>$1" while $doc =~ m!(\w+)!g; Выводятся только английские слова. А как получить все русские слова из html документа? |
Отвечаю на свой же впрос:
print "<br>$1" while $doc =~ m!([абвгдеёжзийклмнопрстуфхцчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ]+)!g; |
Часовой пояс GMT +4, время: 02:43. |
Copyright © 1999-2008 Flasher.ru. All rights reserved.
Работает на vBulletin®. Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot
Администрация сайта не несёт ответственности за любую предоставленную посетителями информацию. Подробнее см. Правила.