Léxico básico del español en Chile

Page 1

A B C D E F G H I J K L É X I C O Q R S T U V W X Y Z A B Á S I C O H I J K L M N Ñ O P Q R S T U V W X Y Z A B C D E L G E S P A Ñ O L Ñ O P Q R S T U V W X Y Z A B C D E F C H I L E L M N Ñ O P Q R S T U V W X Y Z A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z

LÉXICO BÁSICO DEL ESPAÑOL DE CHILE A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z Q R S T U V W X Y Z A B C D E F G H I J K L É X I C O L M N Ñ O P Q R S T U V W X Y Z A B Á S I C O H I J K P Q R S T U V W X Y Z A B C D E L G E S P A Ñ O L Ñ Q Ñ O P Q R S T U V W X Y Z A B C D E F C H I L E L M N A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z

M A R Í A N ATA L I A C A S T I L LO FA D I Ć A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z A B C D E F G H I J K L É X I C O Q B Á S I C O X Y Z A B C D E F D E L J E S P A Ñ O L Q R S T U V W X Y Z A B C D E F C H I L E L M N Ñ O P Q R S T U V W X Y Z A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z PRÓLOGO DE HUMBERTO LÓPEZ MORALES


LÉXICO BÁSICO DEL ESPAÑOL DE CHILE M A R Í A N ATA L I A C A S T I L LO FA D I Ć PRÓLOGO DE HUMBERTO LÓPEZ MORALES


ÍNDICE

Agradecimientos

9

Prólogo

11

Exordio

13

§ 1 Información básica: para comprender y usar este diccionario 1.1. Símbolos y abreviaturas 1.2. Organización del diccionario 1.3. Organización de la información dentro de cada artículo lexicográfico

15 15 16

§ 2 Información para usuarios y educadores

19

§ 3 Aspectos técnicos: del Corpus Básico al Léxico básico del español de Chile 3.1. Políticas lingüísticas: léxico básico y educación 3.2. El Corpus Básico del Español de Chile 3.3. Léxico básico del español de Chile: fundamentos teóricos 3.4. Procesamiento del corpus: lematización y segmentación 3.5. Curvas de cobertura y representatividad del corpus 3.6. Vocablos de mayor uso 3.7. Constitución final del Léxico básico

23 23 26 30 34 36 38 42

§ 4 Referencias bibliográficas

45

§ 5 Fuentes

47

Léxico básico del español de Chile: el diccionario

17

105


| 15

§1 INFORMACIÓN BÁSICA: PARA COMPRENDER Y USAR ESTE DICCIONARIO

El Léxico básico del español de Chile es un diccionario que contiene los 4.831 vocablos de mayor uso en el español chileno actual. Ha sido construido a partir de diversos muestreos sobre un corpus de más de 500.000 palabras extraídas de fuentes escritas de primera mano —seleccionadas sin sesgo ético ni estético— publicadas en un período de veintiséis años entre los siglos XX y XXI. Por su tipología y naturaleza, este diccionario no incluye definiciones. Las unidades léxicas —monoverbales y pluriverbales— se organizan de acuerdo con el orden alfabético internacional y funcionan como lemas de artículos lexicográficos. Para cada uno de ellos se entrega información gramatical y estadística y se da cuenta de los tipos o variantes a través de los cuales aparece efectivamente realizado el vocablo en el corpus. En el caso de los verbos, se incluyen las conjugaciones, las realizaciones voseantes, los tiempos compuestos, la voz pasiva y los adjetivos participiales, aun cuando estén en diminutivo. En el caso de sustantivos y adjetivos, se consignan los diminutivos y aumentativos que no implican cambio semántico. Por economía, si un vocablo solo incluye un tipo y este coincide con el lema, no se repite el tipo bajo el vocablo. Para facilitar el uso del diccionario, se aplican marcas gramaticales simplificadas, basadas en la gramática tradicional.

1.1. SÍMBOLOS Y ABREVIATURAS 1 2 3 ADJ CAL

primera persona segunda persona tercera persona adjetivo calificativo


16 | LÉXICO BÁSICO DEL ESPAÑOL DE CHILE

ADJ DEM ADJ EXCL ADJ IND ADJ INT ADJ NUM ADJ POS ART DEF ART IND ADV CONJ COORD CONJ SUB I i PREP PRON PRON DEM PRON EXCL PRON IND PRON INT PRON PERS PRON POS PRON REL SUST V V AUX V SEMI AUX

adjetivo demostrativo adjetivo exclamativo adjetivo indefinido adjetivo interrogativo adjetivo numeral adjetivo posesivo artículo definido artículo indefinido adverbio general conjunción coordinada conjunción subordinada interjección modo imperativo preposición pronombre pronombre demostrativo pronombre exclamativo pronombre indefinido pronombre interrogativo pronombre personal pronombre posesivo pronombre relativo sustantivo común verbo verbo auxiliar verbo semiauxiliar

1.2. ORGANIZACIÓN DEL DICCIONARIO Los vocablos están ordenados de acuerdo con el orden alfabético internacional; es decir, dígrafos como ch o ll aparecen bajo C en el caso de ch y bajo L en el caso de ll. Esto permite buscar fácilmente una unidad léxica, para saber si forma parte del léxico básico y, en caso de que forme parte, conocer sus índices estadísticos. En la sección 3.6, además, destacamos los cien vocablos de mayor uso en el español de Chile, ordenados por rango de uso, de mayor a menor. Esto pretende facilitar la tarea de los educadores que, si lo desean, podrán programar


36 | LÉXICO BÁSICO DEL ESPAÑOL DE CHILE

3.5. CURVAS DE COBERTURA Y REPRESENTATIVIDAD DEL CORPUS Nuestro corpus presenta una curva de cobertura similar al de Morales (1986), con fuentes escritas como las nuestras, pero disímil respecto del de Ávila (1998), con fuentes orales. Esto confirma lo señalado por Ávila (1998, pág. 257) respecto de que la cobertura se alcanza con mayor rapidez en corpus formados por textos orales, lo que se ratifica también al observar en nuestro corpus que la mayor velocidad sostenida de cobertura se logra en Drama, donde las oraciones que conforman el corpus de referencia corresponden a parlamentos pensados para ser emitidos oralmente por actores, emulando intercambios orales en presentaciones frente a público.

Vocablos

Drama

Narrativa

Ensayo

TécnicoCientífico

Prensa

Primeros 50

52,45317%

50,36652%

50,15457%

50,38526%

49,86673%

Primeros 100

60,64938%

56,28222%

55,33256%

55,39573%

54,38839%

Primeros 500

77,15970%

71,24919%

71,37668%

71,69272%

68,61179%

Primeros 1.000

83,27389%

78,02884%

79,32885%

79,94999%

76,20969%

Primeros 2.000

88,94250%

84,72088%

86,70557%

87,71627%

83,89819%

Primeros 3.000

91,96663%

88,44248%

90,52453%

91,54045%

87,91943%

Primeros 4.000

93,96473%

90,90644%

92,88141%

93,83170%

90,46049%

Primeros 5.000

95,31845%

92,92029%

94,69753%

95,43274%

92,56750%

Primeros 6.000

96,31750%

94,12961%

95,71783%

96,44927%

93,64103%

Figura 4. Cobertura del corpus

En efecto, al comparar las curvas de cobertura por mundo (Figuras 4 y 5). Drama alcanza una cobertura superior al 60% en el rango 100, mientras los demás se encuentran alrededor del 55% en promedio, con Prensa en último lugar. Mientras Drama sube del 80% en el rango 1.000, seguido de cerca por TécnicoCientífico, los demás se mantienen por debajo de esta cifra. Drama, Ensayo y Técnico-Científico llegan al 90% de cobertura antes del rango 3.000, mientras Prensa y Narrativa lo logran alrededor del rango 4.000.


3. Aspectos técnicos: del corpus básico al léxico básico del español de Chile | 37

La menor velocidad de cobertura se observa de manera sostenida en Prensa. Narrativa presenta una cobertura inicial levemente mayor que la de los demás mundos hasta el rango 100, donde ralentiza su avance, situándose en el rango 6000 solo medio punto sobre Prensa. 100,00

90,00

80,00

70,00

60,00

50,00

40,00 0

1.000 Drama

2.000 Narrativo

3.000 Ensayo

4.000

5.000

Técnico-Científico

6.000 Prensa

Figura 5. Curva de cobertura por mundo.

Ensayo y Técnico-Científico presentan curvas similares de cobertura, aunque este último mundo alcanza la cobertura más tempranamente y se distancia progresivamente del primero a partir del rango 1000, para alcanzar máxima cobertura sobre el 6000, ubicándose por encima de Drama. En todos los casos, y como sucede en investigaciones similares (cf. por ejemplo Ávila 1999, pág. 93), la curva presenta su mayor ascenso en los primeros deciles, mostrando luego un crecimiento progresivamente menor, que tiende a estabilizarse en el tercer segmento —500 primeras palabras— en el caso de Drama, por su cercanía con la oralidad, y en el cuarto —1.000 primeras palabras— en los demás.


38 | LÉXICO BÁSICO DEL ESPAÑOL DE CHILE

3.6. VOCABLOS DE MAYOR USO A continuación presentamos los cien vocablos de mayor uso, ordenados según este índice de mayor a menor (cf. Figura 6). Rango

Lema

Categoría

Frecuencia

Dispersión

Uso

1

el

art

57215

0,91

52065,65

2

de

prep

33182

0,88

29200,16

3

y

conj coord

14269

0,95

13608.35

4

a

prep

12510

0,95

11884,5

5

en

prep

12844

0,89

11431,16

6

un

art def

10128

0,95

9621,6

7

que

pron rel

9676

0,97

9385,72

8

ser

v semi aux

7125

0,87

6198,75

9

que

conj sub

6901

0,84

5796,84

10

se

pron

6114

0,94

5747,16

11

su

adj pos

5464

0,89

4862,96

12

por

prep

4735

0,95

4498,25

13

con

prep

4380

0,91

3985,8

14

no

adv

5733

0,68

3898,44

15

para

prep

3496

0,95

3321,2

16

como

conj sub

2829

0,92

2602,68

17

este

adj dem

2559

0,83

2123,97

18

más

adv

2085

0,94

1959,9

19

lo

pron pers

2705

0,72

1947,6

20

estar

v aux

2275

0,74

1683,5

21

tener

v

2176

0,77

1675,52

22

se

pron pers

1652

0,93

1536,36

23

poder

v

1772

0,85

1506,2

24

hacer

v

1777

0,81

1439,37

25

o

conj coord

1705

0,78

1333,51

26

todo

adj ind

1322

0,89

1176,58

27

le

pron pers

1783

0,65

1158,95

28

pero

conj coord

1471

0,74

1088,54

29

ese

adj dem

1256

0,79

992,24


3. Aspectos técnicos: del corpus básico al léxico básico del español de Chile | 39

Rango

Lema

Categoría

Frecuencia

Dispersión

Uso

30

decir

v

1416

0,68

962,88

31

si

conj sub

1232

0,75

924

32

me

pron pers

2786

0,33

919,38

33

él

pron pers

1119

0,78

872,82

34

sin

prep

906

0,9

815,4

35

otro

adj ind

890

0,9

801

36

entre

prep

930

0,85

790,5

37

ir

v

1390

0,52

722,8

38

dar

v

820

0,85

697

39

haber

v

829

0,84

696,36

40

mismo

adj cal

783

0,87

681,21

41

año

sust

833

0,8

666,4

42

deber

v

817

0,81

661,77

43

sobre

prep

765

0,86

657,9

44

nos

pron pers

886

0,74

655,64

45

ver

v

987

0,65

641,55

46

cuando

conj sub

836

0,73

610,28

47

también

adv

672

0,87

584,64

48

este

pron dem

704

0,83

584,32

49

ya

adv

793

0,72

570,96

50

hasta

prep

632

0,9

568,8

51

desde

prep

651

0,87

566,37

52

vez

sust

672

0,81

544,32

53

mi

pron pos

1416

0,38

538,08

54

porque

conj sub

769

0,69

530,61

55

vida

sust

613

0,82

502,66

56

nuevo

adj cal

606

0,81

490,86

57

los

pron pers

612

0,78

477,36

58

alguno

adj ind

518

0,92

476,56

59

nuestro

pron pos

617

0,77

475,09

60

todo

pron ind

677

0,69

467,13

61

primero

adj num

565

0,82

463,3

62

dos

adj num

553

0,83

458,99

63

día

sust

600

0,76

456


| 107

A a PREP

abajo

11884.50 2808 2804 ADV

abandonar V abandona 3 abandona i abandonaba abandonada abandonadas abandonado abandonados abandonamos abandonan abandonando abandonar abandonaré abandonaron abandonas abandonase abandone abandoné abandonéis abandonen abandonó habían abandonado había abandonado han abandonado has abandonado ha abandonado

12510 0.95 2196 2186 2516

21.09 37 0.57 11 18 5 1 2 53.28 74 0.72 22 27 11 4 10 5 0 0 0 0 0 0 0 0 1 0 2 0 0 0 1 1 1 0 0 1 0 0 0 0 3 1 1 0 0 1 1 0 0 0 0 1 0 0 0 1 0 0 1 0 0 4 1 1 1 2 4 7 1 4 0 1 0 0 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0 0 1 1 0 0 1 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 3 2 0 0 2 0 2 0 0 0 0 1 0 0 0 0 2 0 0 0 3 0 0 0 0 0 0 1 0 0

abandono SUST

11.85 15 0.79 2 2 4 5 2

abanico SUST

3.00 4 0.75 1 1 1 0 1 1 0 1 0 1

abanico

abanicos

0

abarcar V

11.68 16 0.73 0 3 4 4 5 0 0 2 2 2 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 2 1 0

abarca abarcaba abarcaban abarcan abarcando abarcar abarcaron abarcó abarque abatir V abatida abatidas abatido abatió abatir ser abatido

1

0

0

0

4.64 8 0.58 2 4 1 1 0 1 0 0 0 0 0 1 0 0 0 0 1 0 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0

abiertamente ADV

4.14 6 0.69 0 1 2 1 2

abismo SUST

8.28 12 0.69 2 3 5 1 1 2 3 5 1 0 0 0 0 0 1

abismo abismos abocar V abocada abocado abocados abocando abocar abocara abocará

5.31 9 0.59 0 3 1 1 4 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 0 2 0 1 0 0 0 0 0 0 0 1


108 | abogado

abogado SUST abogada abogado abogados abordar V aborda abordaba abordado abordados abordamos abordan abordando abordar abordaré abordó fueron abordados fue abordado han sido abordados ser abordado ser abordados abrazar V abrace abraza abrazaba abrazaban abrazada abrazados abrazamos abrazan abrazando abrazar abrazaron abrazo abrazó había abrazado

32.90 47 0.70 9 8 6 4 20 2 0 0 0 1 7 6 5 2 14 0 2 1 2 5 21.76 34 0.64 0 3 9 8 14 0 0 1 1 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 2 0 0 0 0 1 0 2 5 4 4 0 0 1 0 0 0 0 0 0 2 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 1 1 0 0 0 0 0 0 1 13.72 28 0.49 14 11 1 1 1 1 0 0 0 0 3 0 0 0 0 2 0 0 0 0 0 1 0 0 1 1 0 0 0 0 1 2 0 0 0 0 1 0 0 0 0 1 0 0 0 2 1 0 0 0 2 2 1 1 0 0 1 0 0 0 1 0 0 0 0 1 1 0 0 0 0 1 0 0 0

abrir V abierta abiertas abierto abiertos abra i abra 1 abra 3 abran 3 abran i abre 3 abre i abren abres abrí abría abrían abriendo abriera abrieras abrieron abrimos abrió abrir abrirá abrirán abriremos abriría abriste abro era abierto fue abierto había abierto han abierto ha abierto hemos abierto he abierto ser abiertas abrumar V

abrazo SUST abrazo abrazos abril SUST abril abriles

4.30 10 0.43 1 6 0 0 3 0 4 0 0 3 1 2 0 0 0 15.86 26 0.61 0 4 3 7 12 0 4 3 7 11 0 0 0 0 1

abruma abrumada abrumado abrumados abrupto ADJ CAL abrupta abruptas

175.50 234 0.75 72 74 44 13 31 1 4 9 2 4 1 2 0 1 3 2 3 9 4 4 0 1 2 0 1 11 0 0 0 0 2 0 0 0 0 1 0 0 0 1 3 0 0 0 0 2 4 0 0 0 8 10 7 2 4 3 0 0 0 1 5 2 1 0 0 3 1 0 0 0 1 1 0 0 0 2 6 0 2 0 2 2 0 0 1 2 6 3 0 0 2 0 0 0 1 1 0 0 0 0 0 2 0 0 0 1 1 0 0 0 2 9 1 0 2 10 13 10 1 6 0 1 0 0 1 0 1 0 0 0 1 0 0 0 0 0 1 1 0 0 1 0 0 0 0 3 2 0 0 0 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 4.24 8 0.53 4 2 2 0 0 1 0 2 0 0 1 0 0 0 0 1 2 0 0 0 1 0 0 0 0 3.40 5 0.68 0 1 2 1 1 0 1 1 0 1 0 0 1 0 0


458 |

V vacaciones SUST

6.50 13 0.50 1 4 1 0 7

vacío ADJ CAL

7.95 15 0.53 4 8 1 0 2 2 2 0 0 0 0 4 0 0 2 2 1 0 0 0 0 1 1 0 0

vacía vacías vacío vacíos vacío SUST vacío vacíos

19.53 31 0.63 12 11 5 3 0 11 11 4 2 0 1 0 1 1 0

válido ADJ CAL válida válidas válido válidos valioso ADJ CAL valiosa valiosas valioso valiosos valle SUST

vago ADJ CAL vaga vagas vago vagos valer V valdría valdrían vale 3 vale i valen valer valga valgan valgo valía valiendo valiera valió validez SUST

3.06 6 0.51 0 2 0 3 1 0 0 0 1 0 0 0 0 0 1 0 1 0 1 0 0 1 0 1 0 59.94 74 0.81 12 10 23 20 9 0 0 1 0 1 0 0 0 1 0 9 3 15 10 3 1 0 0 0 0 0 1 1 1 0 0 1 2 7 0 1 0 1 0 0 0 0 1 0 0 0 1 1 0 0 0 3 0 1 1 0 1 0 0 1 0 0 1 0 0 1 0 0 0 3 8.00 16 0.50 0 1 6 8 1

valle valles valor SUST valor valores valoración SUST valoración valoraciones valorar V valora valoraba valoradas valorado valoramos valorando valorar valoró

5.50 10 0.55 0 1 5 3 1 0 1 2 1 0 0 0 1 0 0 0 0 1 1 1 0 0 1 1 0 11.34 18 0.63 2 0 4 8 4 0 0 0 2 0 0 0 0 1 0 2 0 3 3 4 0 0 1 2 0 9.38 14 0.67 5 5 2 1 1 3 5 2 1 1 2 0 0 0 0 119.90 218 0.55 11 5 109 68 25 11 5 31 36 17 0 0 78 32 8 5.85 15 0.39 0 1 3 10 1 0 1 3 8 1 0 0 0 2 0 9.86 17 0.58 0 1 8 5 3 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 5 5 0 0 0 0 0 1


vegetal | 459

valorización SUST

3.92 8 0.49 1 0 3 4 0 0 0 3 4 0 1 0 0 0 0

varios ADJ IND

vano SUST

3.64 7 0.52 3 3 1 0 0

varios PRON IND

vapor SUST

3.40 5 0.68 1 2 0 1 1 1 0 0 1 0 0 2 0 0 1

valorización valorizaciones

vapor vapores vara SUST

4.64 8 0.58 0 2 3 3 0

varias varios

varias varios varón SUST varón varones vaso SUST

variable

SUST

variable variables

8.40 30 0.28 0 0 5 23 2 0 0 2 6 0 0 0 3 17 2

vaso vasos vasto ADJ CAL

variación SUST variación variaciones variante SUST variante variantes variar V habría variado han variado varía variada variadas variado variados varían variando variar variaron varió variedad

SUST

variedad variedades

10.50 15 0.70 1 2 2 6 4 1 1 2 3 0 0 1 0 3 4 3.92 8 0.49 0 1 0 4 3 0 1 0 3 2 0 0 0 1 1 30.72 48 0.64 2 4 13 21 8 0 0 0 1 0 0 0 1 0 1 0 0 0 2 1 1 0 0 2 0 1 1 1 6 0 0 0 3 0 1 0 0 2 4 2 0 0 1 1 0 0 0 0 3 0 0 2 3 2 2 0 1 1 0 0 0 0 1 0 1 14.52 22 0.66 1 4 4 10 3 0 3 4 8 2 1 1 0 2 1

vasta vastas vastísima vasto vastos vecino ADJ CAL vecina vecinas vecino vecinos vecino SUST vecina vecinas vecino vecinos

121.18 146 0.83 10 37 34 33 32 4 20 16 18 10 6 17 18 15 22 5.00 5 1.00 1 1 1 1 1 0 0 0 1 0 1 1 1 0 1 7.68 12 0.64 1 1 4 5 1 1 0 0 4 0 0 1 4 1 1 4.96 16 0.31 2 12 0 1 1 1 6 0 0 1 1 6 0 1 0 5.94 11 0.54 0 1 6 2 2 0 0 2 1 1 0 0 1 0 0 0 0 1 0 0 0 1 2 1 0 0 0 0 0 1 10.64 14 0.76 2 3 3 1 5 1 1 0 0 1 1 1 0 0 0 0 1 0 1 2 0 0 3 0 2 23.04 32 0.72 5 12 3 3 9 2 4 0 1 0 2 2 0 0 0 1 2 1 1 1 0 4 2 1 8

vegetación SUST

4.48 7 0.64 3 2 1 1 0

vegetal ADJ CAL

4.97 7 0.71 1 2 2 2 0 1 1 2 2 0 0 1 0 0 0

vegetal vegetales


El Léxico básico del español de Chile es un diccionario de frecuencias: un tipo poco habitual de diccionario que registra las alrededor de cinco mil palabras más usadas en nuestro país, basado en el análisis estadístico de más de 500 mil palabras extraídas de alrededor de cuatro mil obras publicadas por autores chilenos en un rango de más de 25 años. Los vocablos que contiene se caracterizan por tener escasa dependencia del tema, contexto, género discursivo o tipo de texto, lo que significa que pueden aparecer en textos orales y escritos dirigidos a públicos diversos en que se traten diferentes temáticas, en diferentes contextos. Conocer y comprender estas palabras permite acceder a más del 90% de los textos producidos en Chile. Contar con un diccionario como este, permite determinar de manera objetiva qué palabras necesitan aprender los estudiantes y en qué orden conviene que las aprendan. Este proyecto busca, por un lado, contribuir a preservar nuestro patrimonio cultural inmaterial, reflejo de nuestra identidad nacional; por otro lado, se propone colaborar con la educación en general, facilitando la planificación de la adquisición del español como lengua materna y del español como segunda lengua y ofreciendo herramientas que contribuyan a la generación de políticas públicas educativas y lingüísticas basadas en la realidad de la lengua.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.