\pL
coincide con cualquier carácter con la propiedad de caracteres Unicode Letter
, que es un grupo importante categoría general; es decir, coincide con [\p{Ll}\p{Lt}\p{Lu}\p{Lm}\p{Lo}]
.
\pN
coincide con cualquier carácter con la propiedad de carácter Unicode Number
, que es un grupo de categoría general importante; es decir, coincide con [\p{Nd}\p{Nl}\p{No}]
.
- Tenga en cuenta que la propiedad de carácter Unicode
Alphabetic
también incluye ciertas marcas de combinación como U + 0345 ◌ ᴄᴏᴍʙɪɴɪɴɢ ɢʀᴇᴇᴋ ʏᴘᴏɢᴇɢʀᴀᴍᴍᴇɴɪ. Le sugiero que también incluya \pM
, que coincide con cualquier carácter con la propiedad de carácter Unicode Mark
, que es un grupo de categoría general importante; es decir, coincide con [\p{Mn}\p{Me}\p{Mc}]
.
- Carácter U + 002D ʜʏᴘʜᴇɴ-ᴍɪɴᴜꜱ es probablemente el
-
al que te refieres.
- Nota sin embargo que v6.1 Unicode tiene 27 caracteres con la propiedad de caracteres Unicode
Dash
, incluyendo caracteres comunes tales como U + ʜʏᴘʜᴇɴ 2010, U + 2013 ᴇɴ ᴅᴀꜱʜ, U + 2014 ᴇᴍ ᴅᴀꜱʜ, y U + 2212 ᴍɪɴᴜꜱ ꜱɪɢɴ . Si realmente quiere incluir o excluir esos, no tengo ni idea.
Teniendo en cuenta todo esto, no es improbable que desea algo como:
[^\pL\pN\pM\x2D\x{2010}-\x{2015}\x{2212}]
*** * Todos los personajes son * “especial” *** Di lo que quieres decir!. – tchrist
caracteres especiales como + _) (* & ^% $ # @! ~, No de ningún idioma ... – CaTz
English ciertamente usa la mayoría de esos caracteres. Muchos de ellos se usan en muchos idiomas. Algunos no lo son. significa que aún no ha definido "especialidad". ** ¿Cuál es la propiedad de carácter Unicode para "especialidad" ???? ** – tchrist