Как следует из названия, я просто пытаюсь придумать регулярное выражение, которое отбрасывало бы следующие иностранные символы ū ų š ą ė ž į ę č, но просто не может добиться успеха. Те что я пробовал ниже выглядят конечно несуразно и самое главное не работают. Буду признателен за любую помощь/комментарии/советы вообще. Большое спасибо!
/^[[:alpha:]\s]+/u/
/^[ū ų š ą ė ž į ę č]+/
/^[[:alpha:]\s]+/u$/
/^[ū ų š ą ė ž į ę č]+$/
=== ОБНОВЛЕНИЕ. ===
Вот регулярное выражение, которое работает в моем случае, я разработал его путем тестирования. То есть любой из этих символов, которые присутствуют в любом месте слова с любыми символами перед этими символами, а также после них.
/^.*č|ę|ė|į|š|ų.*$/
Однако теперь он срабатывает OK только для символа š, все остальные почему-то не работают. Любые дальнейшие комментарии кто-нибудь, пожалуйста? Спасибо!
=== ОБНОВЛЕНИЕ 2. ===
Я был неправ. Это не удается и на š. Теперь у меня есть регулярное выражение, но я считаю, что оно сводится к правильной кодировке и прочему.
=== ОБНОВЛЕНИЕ 3. ===
эхо $LANG возвращает:
en_US.UTF-8
локальный шармап повторяет:
UTF-8
локаль -а возвращает:
C
C.UTF-8
en_US.utf-8
POSIX