|
|
« Предыдущая тема | Следующая тема » |
Опции темы | Опции просмотра |
|
|
|||||
Цитата:
То есть вот так: Регулярка будет соответствовать слешу
__________________
Ко мне можно и нужно обращаться на ты) |
|
|||||
caseyryan, так у меня в регулярке и нет обратных слешей. Ищу все хэштеги в тексте, в котором есть еще емодзи )
Проблема в том, что регулярка считает эмодзи за 1 символ, хотя в тексте каждый состоит из двух символов unicode - суррогатная пара. В итоге при проходе в цикле неправильно возвращается index начала каждого хэштега в тексте. Но если использовать методы класса String - индексы символов возвращаются верно...
__________________
кто не отвечает, того garbage collector забирает |
|
|||||
Цитата:
__________________
Ко мне можно и нужно обращаться на ты) |
|
|||||
caseyryan, я понимаю, что слэш нужно экранировать для его поиска... Но в моем-то случае это зачем?... Как мне нужно регулярку поправить? Что-то совсем не пойму..
И эти слэши в юникоде, как я понимаю, даже не доходят до регулярки - юникодовый текст преобразовывается в символы и смайлы до попадения в регулярку. Вот, например, в юникоде слово 'Отметь' С помощью регулярки нахожу и окрашиваю подстроку 'мет': Слэши не мешают никак. Регулярка справляется со своей задачей.
__________________
кто не отвечает, того garbage collector забирает |
Часовой пояс GMT +4, время: 07:18. |
|
« Предыдущая тема | Следующая тема » |
Теги |
emoji , unicode , смайлики , хэштег , юникод |
|
|