2012-08-16 23 views
17

En Bash me puede escribir la siguiente pruebaBash - pruebas para comprobar si una cadena es 'mayor' que otro - ¿cómo funciona internamente?

[[ "f" > "a" ]] 

lo que se traduce en la devolución de 0, es decir, cierto. ¿Cómo funciona realmente bash esta comparación de cuerdas? Desde mi entendimiento, > hace una comparación entera. ¿Intenta comparar el valor ASCII de los operandos?

+1

Sí, sospecho que tiene un problema polimorfo pasando donde> significa una cosa con dos cadenas y otra con dos números. Sin embargo, no soy un codificador de bash experimentado. – VoronoiPotato

Respuesta

8

De help test:

STRING1 > STRING2 
       True if STRING1 sorts after STRING2 lexicographically. 

Internamente, golpe del bien utiliza strcoll() o strcmp() para ello:

else if ((op[0] == '>' || op[0] == '<') && op[1] == '\0') 
    { 
    if (shell_compatibility_level > 40 && flags & TEST_LOCALE) 
     return ((op[0] == '>') ? (strcoll (arg1, arg2) > 0) : (strcoll (arg1, arg2) < 0)); 
    else 
     return ((op[0] == '>') ? (strcmp (arg1, arg2) > 0) : (strcmp (arg1, arg2) < 0)); 
    } 

En efecto, éste compara los códigos ASCII, la antigua (se utiliza cuando se habilita la configuración regional) realiza una una comparación más específica que es adecuada para clasificar en un lugar determinado.

7

Es una comparación alfabético (AIUI el orden de clasificación puede estar influenciada por la localización actual). Compara el primer carácter de cada cadena, y si el de la izquierda tiene un valor más alto, es verdadero, si es menor, es falso; si son la misma, entonces se compara el segundo carácter, etc.

Ésta es no lo mismo que la comparación de enteros, para que utilice [[ 2 -gt 1 ]] o ((2 > 1)). Para ilustrar la diferencia entre la cadena y la comparación de enteros, tenga en cuenta que todos los siguientes son "verdadero":

[[ 2 > 10 ]]  # because "2" comes before "1" in ASCII sort order 
[[ 10 -gt 2 ]] # because 10 is a larger number than 2 
((10 > 2))  # ditto 
1

Sí, se compara el valor ascii y si es igual después repetir la comparación en el siguiente carácter.

/* Copyright (C) 1991, 1996, 1997, 2003 Free Software Foundation, Inc. 
    This file is part of the GNU C Library. 

    The GNU C Library is free software; you can redistribute it and/or 
    modify it under the terms of the GNU Lesser General Public 
    License as published by the Free Software Foundation; either 
    version 2.1 of the License, or (at your option) any later version. 

    The GNU C Library is distributed in the hope that it will be useful, 
    but WITHOUT ANY WARRANTY; without even the implied warranty of 
    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU 
    Lesser General Public License for more details. 

    You should have received a copy of the GNU Lesser General Public 
    License along with the GNU C Library; if not, write to the Free 
    Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 
    02111-1307 USA. */ 

#include <string.h> 
#include <memcopy.h> 

#undef strcmp 

/* Compare S1 and S2, returning less than, equal to or 
    greater than zero if S1 is lexicographically less than, 
    equal to or greater than S2. */ 
int 
strcmp (p1, p2) 
    const char *p1; 
    const char *p2; 
{ 
    register const unsigned char *s1 = (const unsigned char *) p1; 
    register const unsigned char *s2 = (const unsigned char *) p2; 
    unsigned reg_char c1, c2; 

    do 
    { 
     c1 = (unsigned char) *s1++; 
     c2 = (unsigned char) *s2++; 
     if (c1 == '\0') 
     return c1 - c2; 
    } 
    while (c1 == c2); 

    return c1 - c2; 
} 
+2

no veo por qué estás pegando alguna función en su mayoría irrelevantes 'strcmp()'. bash admite configuraciones regionales, y en este caso utiliza 'strcoll()' para realizar una comparación adecuada para un juego de caracteres en particular. –

+0

Está bien, pero strcmp ilustra la comparación de cadenas en una forma más simple. El propósito es mostrar cómo comparar una cadena en general y no la implementación de bash específica. El método es el mismo en bash, Python, Perl, PHP, C, Java ... – olivecoder

+0

Más ... la pregunta no es sobre el nombre de la función, sino de método. – olivecoder

Cuestiones relacionadas