Regular Expressions : Non-Printable Karakterler
Yazan : Yusuf Nar, Eylül 08, 2006, Cuma 15:56
Etiket(ler) : regex, Unicode
Regex ifadelerinde görünmeyen karakterleri eşleştirmek için bu karakterler için tanımlanan özel ifadeleri kullanmalıyız. Örneğin regex ifadelerinde tab bulunamaz ve dolayısıyla tab karakterini eşleştirmek için \t kullanılmalıdır.
CR (Carriage Return) için \r, LF (Line Feed) için \n, Boşluk karakteri için \s kullanılır. Şunu hatırlatmakta fayda var; Windows tabanlı editörlerde satır sonu için \r\n, Unix tabanlılarda ise \n ifadesi kullanılır.
Unicode Karakter Kodlarının Kullanımı
Ayrıca herhangi bir karakterin unicode code karşılığını kullanarak \uFFFF şeklinde bu karakteri eşleştirebiliriz. Örneğin a karakterinin unicode karşılığı 0x0061'dir ve bu karakteri eşleştirmek için \u0061 ifadesi kullanılır.