Introducción al dataferrett cic 2 abril 2016

Page 1

UNIVERSIDAD DE PUERTO RICO EN CAYEY INSTITUTO DE INVESTIGACIONES INTERDISCIPLINARIAS CENTRO DE INFORMACIÓN CENSAL

Introducción al DataFerrett Dr. José G. Caraballo-Cueto, Director Centro de Información Censal


Objetivos  Conocer la estructura de los Datos del Censo y del DataFerrett usando el Censo de Población y Vivienda, el American Community Survey y el County Business Patterns.  Seleccionar los bancos de datos de forma informada y consciente.  Construir tablas sencillas y de múltiples variables, según el interés del usuario.  Seleccionar las variables y editarlas correctamente.  Seleccionar las zonas geográficas pertinentes al interés del usuario.

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

2


¿Qué es el DataFerrett?  Es una herramienta de extracción y análisis de

datos  Es una aplicación gratuita del Negociado del Censo de los Estados Unidos  Permite al usuario construir tablas, gráficos y mapas para visualizar los resultados del análisis  Generalmente se utiliza cuando no se encuentra la tabla de interés en American FactFinder (AFF) por el nivel de especificidad del estudio

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

3


Principales Bancos de Datos disponibles para Puerto Rico en DataFerrett American Community Survey & Puerto Rico Community Survey & PUMS

• Estima y describe características de la población • Reporte 2005 al 2014 (demográficos y socioeconómicos) • Publica datos de ACS con estimados de 1, 3 y 5 años • PUMS: Muestras de 1%, 3% y 5% de la población

Decennial Population and Housing Census & PUMS

• Cuenta la población y unidades de vivienda • Publica datos de los compendios censales SF1 y SF2 (2000) • Publica datos de los compendios censales SF1, SF2, SF3 y SF4 • PUMS: Muestras de 1%, 5% y 10% de la población

County Business Patterns

• Provee datos económicos anuales por industria (NAICS, SIC) • Estudia actividad económica de pequeñas áreas y analiza cambios económicos durante el tiempo • Variables: número de establecimientos, cantidad de personas empleadas por industria y nómina

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

4


Estructura de los Datos del Censo Decenal Censo Poblacional 1980, 1990 y 2000

Trabaja con variables que no son económicas. Las encuestas son de toda la población.

Trabaja variables económicas. Para las encuestas se toma una muestra.

Marzo 2016

Censo Poblacional 2010

Forma corta Redistricting Data SF SF1 100% Data SF2 100% Data

Forma corta Redistricting Data SF SF1 100% Data SF2 100% Data

Forma larga

Forma larga Sustituida por el “American Community Survey” (ACS) ACS 1-year estimates ACS 3-year estimates ACS 5-year estimates

SF3 Sample Data SF4 Sample Data

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

5


“American Community Survey (ACS)” PUMS (Public Use Microdata Sample) ACS-PUMS Content: Housing American Community Survey (ACS)

• Muestra:

Es una encuesta nacional que permite obtener estimados de población, en especial de características sociales y económicas

EU- 3 millones de direcciones anuales PR- 36,000 direcciones anuales

• Estimados: • 1 año – comunidades de 65,000 habitantes o más • 3 años- comunidades de 20,000 habitantes o más • 5 años- todas las comunidades

ACS-PUMS

Marzo 2016

Es una muestra de la población y de las unidades de viviendas reportadas en el ACS

Age of Householder House Heating Fuel Household Size Kitchen Facilities Occupancy and Vacancy Owner Statistics Plumbing Facilities Race of Householder Renter Statistics

Rooms and Bedrooms Telephone Service Tenure Units in Structure Value of Home Vehicles Available Year Householder Moved Into Unit Year Structure Build

ACS-PUMS Content: Population Social Ancestry Citizenship & Year of Entry Disability Status Educational Attainment Field of Degree Health Insurance Grandparents Fertility Language Marital Status & History Place of Birth Migration

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

Relationship School Enrollment Veteran Status Economic Employment & Work Status Income & Earnings Industry & Occupation Class of Worker Commuting Poverty Status SNAP Receipt Demographic Age & Sex & Race & Hispanic Origin 6


Comparando los ACS ACS – Estimados de 5 años  2014 → 2010 – 2014 ACS  2013 → 2009 – 2013 ACS  2012 → 2008 – 2012 ACS

ACS – Estimados de 3 años  2013 → 2011 – 2013 ACS  2012 → 2010 – 2012 ACS  2011 → 2009 – 2011 ACS  2010 → 2008 – 2010 ACS

 2011 → 2007 – 2011 ACS  2010 → 2006 – 2010 ACS  2009 → 2005 – 2009 ACS

Marzo 2016

 2009 → 2007 – 2009 ACS

 2008 → 2006 – 2008 ACS  2007 → 2005 – 2007 ACS

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

7


División Geográfica de Puerto Rico

Puerto Rico [State]

Municipios [County] (78)

Sub-divisiones de Municipios [County Subdivisions] (Barrios) (902)

DIVISIÓN GEOGRÁFICA DE LOS PUMS ↓ Nación ↓ Todos los estados, incluyendo a Washington DC y a Puerto Rico ↓ Public Use Microdata Area (PUMAs) → lugares con más de 100,000 personas

Sub-barrios [Subminor Civil Division 067] (145)

Sectores Censales (945)

Grupos de bloques (2,594)

Bloques (77,189)

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

8


Guía de Usuario de DataFerrett

Para conseguir la Guía de Usuario de DataFerrett puede acceder a http://dataferrett.census.gov/UserResources/ DataFerrett_UserGuide.pdf

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

9


Accediendo a DataFerrett Requisitos para trabajar con DataFerrett en el computador:

Enlace directo: http://dataferrett.census.gov/

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

10


Para entrar al programado de DataFerrett, deberรก escribir un correo electrรณnico en la pรกgina principal.

Marzo 2016

DR. JOSร G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

11


Pantalla principal

Icono

Descripción Para abrir un trabajo existente de DataFerrett Para guardar las variables que se están utilizando en el trabajo Para volver a la pantalla principal Para seleccionar el banco de datos y las variables a investigar Para modificar las variables a investigar y construir la tabla deseada Para acceder a la Guía de Usuario de DataFerrett Para acceder directamente a “Step1: Select Dataset & Variable”

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

12


Pantalla: “Step1: Select Dataset & Variable”

Para seleccionar el tipo de data

Buscador de variables

Para ver la definición de las variables y seleccionarlas Base datos disponibles en DataFerrett

Para ver el contenido de cada base de datos.

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

13


Pantalla: “Step2: DataBasket / Download / Make A Table”

Eliminar el trabajo completo

Visualización de las variables seleccionadas en el Step1

Icono

Descripción

Icono

Current Query Variables:

Descripción

Recode Variable

Para modificar la variable (ej. Fijar grupos de edad)

Delete Variable(s)

Para eliminar la(s) variable(s)

Name

Nombre de la variable, según el Negociado del Censo

Variable Label

“Label” de la variable, según el Negociado del Censo

View/Modify Variable(s)

Para ver y modificar la variable en su estado original

Availability

Los periodos para los que está disponible la variable

Para añadir la variable de tiempo (ej. 2010, 2011…)

Download

Para descargar las variables trabajadas en otros formatos (ej. SPSS, SAS, etc.)

Add Time/Series Time Save Selected Variable(s) CodeBook

Para guardar las variables trabajadas en el computador

Make A Table

Para construir la tabla deseada

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

14


Pantalla: “Ferrett Tabulation”

Hoja de trabajo (espacio para construir la tabla)

Variables listas para desplegar en la hoja de trabajo

Referencias

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

15


Funciones de la pantalla: “Ferrett Tabulation”

Editar tamaño, tipo y estilo de letra del contenido de la hoja de trabajo

Editar el contenido de la hoja de trabajo: copiar, pegar, recortar, seleccionar todo, ocultar una fila/columna, borrar, insertar, sortear de forma ascendente o descendente, entre otros

Visualización de la variable de pesaje, establecer si se desea que el programado dé los porcientos, entre otras opciones

Añadir otra hoja de trabajo, abrir una hoja existente, guardar en el dispositivo en cuestión, imprimir toda o parte del contenido de la hoja, convertir en PDF, editar gráficas, mapas, y salir de la pantalla Comando para traer los datos Para crear gráficos y mapas a la hoja de trabajo

Marzo 2016

Tipo de visualización del contenido de la hoja de trabajo

Para eliminar todo el contenido de la hoja de trabajo

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

Para fijar los porcientos

16


Ejemplo #1 Encuesta sobre la Comunidad de Puerto Rico (PUMS) – Estimado de un año

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

17


Creando una tabla sencilla en DataFerrett Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014 Variables: → Sex: SEX → Weight variable: PWGTP

Para seleccionar los tópicos de interés, hacer click izquierdo sobre el recuadro.

Geographical Zone: → Puerto Rico

Click izquierdo para ver las variables disponibles para ese año. Se está trabajando con el año que está sombreado.

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

Luego de seleccionar el tópico, hacer click izquierdo sobre “Search Variables” para ver todas las variables disponibles para el/los tópico/s seleccionado/s.

18


Creando una tabla sencilla en DataFerrett-Continuación

Variables encontradas

Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014 Variables: → Sex: SEX → Weight variable: PWGTP

Para escoger los periodos de estudio, hacer doble click izquierdo sobre uno de los años y luego, presionando shift + ↓, seleccionar los años restantes. Finalmente, hacer click izquierdo al lado de los periodos.

Geographical Zone: → Puerto Rico

Seleccionar las variables de interés una a una, haciendo click izquierdo sobre cada variable.

Listado de variables encontradas

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

19


Creando una tabla sencilla en DataFerrett-Continuación ¡Recomendación!

Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014

Para garantizar la confiabilidad de la búsqueda, se recomienda buscar el libro de definiciones que provee el Negociado del Censo de los Estados Unidos para cada base de datos. En él, encontrará un desglose del contenido de cada variable, lo que le ayudará a guiar su búsqueda en DataFerrett mucho más rápido.

Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico

Entrar a http://census.gov/

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

20


Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014 Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

21


Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014 Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

22


Creando una tabla sencilla en DataFerrett-Continuación

http://www.census.gov/programs-surveys/acs/technicaldocumentation/pums/documentation.html

Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014 Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico

“PUMS Data Dictionary”

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

23


Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014

Cantidad de variables guardadas

Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico Resumen: → Seleccionar variable, haciendo click izquierdo sobre ella → Hacer click izquierdo en “ ” → En la pantalla “Browse/Select Variables & Values, marcar la alternativa de “Select” → Hacer click izquierdo en “OK” → En la pantalla de “Confirmation”, hacer click izquierdo en “OK”

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

24


Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014

En la pantalla

Hacer click izquierdo para construir la tabla deseada

Variables: → Sex: SEX → Weight variable: PWGTP

Herramientas para trabajar con las variables seleccionadas

Geographical Zone: → Puerto Rico

Las variables seleccionadas para preparar la tabla final

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

25


Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014

Herramientas

Listado de variables seleccionadas

Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico

Espacio para construir la tabla

Para borrar la tabla construida Para construir una gráfica con la tabla creada

Referencias

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

26


Creando una tabla sencilla en DataFerrett-Continuación Datasets: → American Community Survey → Puerto Rico Use Microdata Sample → 2006 to 2014

Para generar los datos de la tabla

Variables: → Sex: SEX → Weight variable: PWGTP Geographical Zone: → Puerto Rico Arrastrar la variable “SEX” , sin soltar el click izquierdo hasta el recuadro deseado Finalmente, puede sombrear la tabla y pegarla en el programado de su preferencia (ej. Excel)

Arrastrar la variable “Instances”, sin soltar el click izquierdo, hasta el recuadro deseado

Para copiar las referencias, sombrear todo y presionar Ctrl + c

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

27


Ejemplo #2 Censo Decenal de Población y Vivienda – 2000 – Puerto Rico

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

28


Realizando cruce de variables y “recode” de variables en DataFerrett Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico

Para seleccionar los tópicos de interés, hacer click izquierdo sobre el recuadro. Seleccionar “Selectable Geographies” porque no es una base de datos de Puerto Rico, por tanto se debe seleccionar

En la pantalla

Click izquierdo para ver las variables disponibles para ese año. Se está trabajando con el año que está sombreado.

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

Luego de seleccionar el tópico, hacer click izquierdo sobre “Search Variables” para ver todas las variables disponibles para el/los tópico/s seleccionado/s.

29


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico

En la pantalla

Hacer doble click izquierdo para seleccionar la Zona Geográfica. Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

30


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico

En la pantalla

Hacer click izquierdo para seleccionar la Zona Geográfica.

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

31


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico

En la pantalla

En el buscador, escribir la Zona Geográfica deseada.

Marzo 2016

Hacer click izquierdo para comenzar la búsqueda.

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

32


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico

Arrastrar la Zona Geográfica deseada , sin soltar el click izquierdo, hasta el recuadro “Selected Geographic Areas”

En la pantalla

Finalmente, hacer click izquierdo para finalizar la búsqueda.

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

33


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT

Continuar con la selección de variables

Geographical Zone: → Puerto Rico Resumen: → Seleccionar variable, haciendo click izquierdo sobre ella → Hacer click izquierdo en “ ” → En la pantalla “Browse/Select Variables & Values, marcar la alternativa de “Select” → Hacer click izquierdo en “OK” → En la pantalla de “Confirmation”, hacer click izquierdo en “OK”

En la pantalla Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

34


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico

Las variables seleccionadas para preparar la tabla final

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

35


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT

Hacer click izquierdo para editar la variable “Age” (25 años o más)

Geographical Zone: → Puerto Rico

En la pantalla

Hacer click izquierdo para activar el icono “Recode Variable” para comenzar a editar la variable “Age” (25 años o más)

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

36


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico

En la pantalla

Hacer click izquierdo para editar el “label” de la variable a crear

Hacer click izquierdo para ir limitando la variable (ej. Escribir 24 para referirse a las personas de 1 a 24 años)

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

Hacer doble click izquierdo para editar el “label” de las categorías creadas de la variable en cuestión (Age)

37


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico

Hacer click izquierdo para editar el “label” de la variable a crear Hacer doble click izquierdo para editar el “label” de las categorías creadas de la variable en cuestión (EDUC)

Hacer click izquierdo en una de las categorías. Luego, seleccionar todas las que constituirán un grupo (ej. 13 a 16 = bachillerato o más), presionando Shift + . Finalmente, presionar “recode”. –Volver a hacer este proceso hasta finalizar con las categorías deseadas.-

En la pantalla Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

38


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000

Hacer click izquierdo para construir la tabla deseada

Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Geographical Zone: → Puerto Rico

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

39


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000

Hacer click izquierdo para generar los datos de la tabla

Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT

Arrastrar la variable “GEOG”, sin soltar el click izquierdo, hasta la celda “C2-R1”

Geographical Zone: → Puerto Rico

Arrastrar la variable “SEX”, sin soltar el click izquierdo, hasta la celda “C2-R1” Arrastrar la variable “AGE (recode)”, sin soltar el click izquierdo, hasta la celda “C1-R2” Arrastrar la variable “BACH OR MORE (recode)”, sin soltar el click izquierdo, hasta la celda “C1-R2”

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

40


Realizando cruce de variables y “recode” de variables en DataFerrett-Continuación Datasets: → Decennial Census (5 Percent File) → County Level → 2000 Variables: → Educational Attainment: EDUC → Sex: SEX → Age: AGE (25 years and over) → Selectable Geographies → Weight: PWEIGHT Finalmente, puede sombrear la tabla y pegarla en el programado de su preferencia (ej. Excel)

Geographical Zone: → Puerto Rico

C

Para copiar las referencias, sombrear todo y presionar Ctrl + c Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

C 41


Ejemplo #3 County Business Patterns – Puerto Rico y municipios de la Región de la Universidad de Puerto Rico en Cayey

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

42


Realizando uniones de base de datos en DataFerrett Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population

Para seleccionar los tópicos de interés, hacer click izquierdo sobre el recuadro. Seleccionar “Selectable Geographies” porque no es una base de datos de Puerto Rico, por tanto se debe seleccionar

Geographical Zone: → Florida, EU → Florida Counties Click izquierdo para ver las variables disponibles para ese año. Se está trabajando con el año que está sombreado.

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

Luego de seleccionar el tópico, hacer click izquierdo sobre “Search Variables” para ver todas las variables disponibles para el/los tópico/s seleccionado/s.

43


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population

Hacer doble click izquierdo para seleccionar la Zona Geográfica.

Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

44


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

Hacer click izquierdo para seleccionar la Zona Geográfica.

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

45


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

En el buscador, escribir la Zona Geográfica deseada.

Marzo 2016

Hacer click izquierdo para comenzar la búsqueda.

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

46


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties Sombrear los municipios de Florida, US, presionando Shift + . Arrastrar los municipios seleccionados, haciendo click izquierdo, sin soltar, hasta el recuadro “Selected Geographic Areas”

En la pantalla

Finalmente, hacer click izquierdo para finalizar la búsqueda. Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

47


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

Hacer doble click izquierdo seleccionar el NAICS Code a utilizarse

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

48


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

49


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

Escribir el NAICS Code a utilizarse

Luego de sombrear el NAICS Code a utilizarse, hacer click izquierdo en “Select” Marzo 2016

Finalmente, hacer click izquierdo para finalizar la selección

Hacr click izquierdo para iniciar la búsqueda del NAICS Code a utilizarse

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

50


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population

c

Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

Hacer doble click izquierdo para seleccionar la variable

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

51


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

52


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties Hacer click izquierdo para seleccionar la base de datos a unirse En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

53


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

54


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

Hacer doble click izquierdo para añadir la tabla de la base de datos: SF3 Deccennial Census

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

55


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000

c

Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

56


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000

Hacer click izquierdo para construir la tabla

Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

En la pantalla Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

57


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

En la pantalla

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

58


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population

c

Geographical Zone: → Florida, EU → Florida Counties

Arrastrar la variable “MERGED-200 Three-digit FIPS County…”, sin soltar el click izquierdo, hasta la celda “C1-R2”. Luego, arrastrar la variable “est” hasta la celda “C2-R1”. Finalmente, arrastrar la variable “P001001” hasta la celda “C3-R2”

En la pantalla

Hacer doble click izquierdo sobre la celda “C2” para sombrear la columna

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

Luego hacer click izquierdo en “FORM” para insertar una fórmula en la columna “C2”. Para que divida la cantidad de establecimientos por la cantidad de personas, con el propósito de obtener cuántos establecimientos hay por personas 59


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000

Hacer click izquierdo para generar los datos de la tabla

Hacer click izquierdo en la celda “C4” para cambiar el título de la columna

Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population Geographical Zone: → Florida, EU → Florida Counties

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

60


Realizando uniones de base de datos en DataFerrett-Continuación Datasets: → County Business Patterns → County Level 2003 → Decennial Census → SF3 2000 Variables: → Retail Trade: NAICS 44-45 → Number of establishments: esp → Selectable Geographies → Table: Total Population

Hacer click izquierdo sobre “Map” para generar un mapa de los resultados

Sombrear, presionando Shift +  para generar un mapa con esos datos

Geographical Zone: → Florida, EU → Florida Counties

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

61


EjERCICIO #1 Encuesta sobre la Comunidad de Puerto Rico (PUMS) – Estimado de cinco años

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

62


INSTRUCCIONES-EJERCICIO 1: Buscar la cantidad de personas empleadas por edad y por clase de trabajador para el periodo 2010-2014 Guía:

Posible solución:

Datasets: → Puerto Rico PUMS → 2010-2014 ACS-5 YEARS

→ Entrar a DataFerrett

Variables:** → Person Weight: PWTGP → Age: AGEP → Class of worker: COW → Employment Status Recode: ESR Geographical Zone: → Puerto Rico

Marzo 2016

→ Seleccionar la base datos → Abrir la ventana de “American Community Survey” → Abrir la venta de “5-Year Estimates – Puerto Rico PUMS” → Seleccionar el periodo “2010-2014” → Seleccionar las variables (realizar este procedimiento con cada variable)** → Seleccionar los tópicos de “Population” y “Replicate Weights” → Click izquierdo en “Search Variables” → Click izquierdo sobre las variables de interés (una a una) e inmediatamente, hacer click izquierdo sobre “Browse/Select Highlighted” → Aparecerá la pantalla: “Browse/Select Variables & Values” → Click izquierdo en “Select” → Click izquierdo en “OK” → Aparecerá la pantalla: “Confirmation” → Click izquierdo en “OK”

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

63


INSTRUCCIONES-EJERCICIO 1: (continuación) Buscar la cantidad de personas empleadas por edad y por clase de trabajador para el periodo 2010-2014 Guía:

Posible solución: (continuación)

Datasets: → Puerto Rico PUMS → 2010-2014 ACS-5 YEARS

→ Modificar las variables (Pantalla: “DataBasket/Download/Make A Table”) → AGEP (Age) → Click izquierdo sobre la variable “AGEP” → Click izquierdo en “Recode Variable”. → Aparecerá la pantalla “Recode/Regroup Variables” → Cambiar el nombre de la variable al de su preferencia para identificar el “recode” en el recuadro que está a la izquierda de “is label for the Variable Recode of AGEP” → Con Shift + ↓ sombrear las edades que formarán la primera categoría** → Click izquierdo en “Recode” → Realizar el mismo proceso para cada categoría de edad sugerida → Al finalizar, hacer click izquierdo sobre “OK”

Variables: → Person Weight: PWTGP → Age: AGEP → Class of worker: COW → Employment Status Recode: ESR Geographical Zone: → Puerto Rico

Categorías AGEP:** AGEP: → 16 a 24 años → 25 a 32 años → 33 a 40 años → 41 a 48 años → 49 a 56 años → 57 a 64 años

Marzo 2016

→ Crear la tabla de interés → Click izquierdo en “Make A Table” → Aparecerá la pantalla “Ferrett Tab Message”. Click izquierdo en “OK” → Aparecerá la pantalla “Ferrett Tabulation”. En ella comenzará a trasladar las variables, que aparecen en el lado derecho, a los recuadros de la hoja de trabajo → RECODE1 (AGEP Categories): a la C1, R2 → COW: a la C1, R2 → ESR: a la C2, R1 → Click izquierdo en “ GO Get Data” DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

64


EjERCICIO #2 Encuesta sobre la Comunidad de Puerto Rico (PUMS) – Estimado de un año

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

65


INSTRUCCIONES-EJERCICIO 2: Buscar la cantidad de personas que no tienen plan médico por edad, sexo y estado civil para los periodos 2012, 2013 y 2014 Guía:

Posible solución:

Datasets: → Puerto Rico Public Use Microdata Sample → 2012, 2013, 2014

→ Entrar a DataFerrett

Variables:** → Person Weight: PWTGP → Age: AGEP → Sex: SEX → Health Insurance Coverage Recode: HICOV → Recoded detailed race code: RAC1P → Married, spouse present/spouse absent: MSP Geographical Zone: → Puerto Rico

Marzo 2016

→ Seleccionar la base datos → Abrir la ventana de “American Community Survey” → Abrir la venta de “Puerto Rico Public Use Microdata Sample” → Seleccionar los periodos “2014, 2013 y 2012”, haciendo doble click izquierdo sobre el “2014”, click izquierdo fuera de los periodos, sombrear los otros periodos con Shift + ↓, y click izquierdo fuera de los periodos → Seleccionar las variables (realizar este procedimiento con cada variable)** → Seleccionar los tópicos de “Population” y “Replicate Weights” → Click izquierdo en “Search Variables” → Click izquierdo sobre las variables de interés (una a una) e inmediatamente, hacer click izquierdo sobre “Browse/Select Highlighted” → Aparecerá la pantalla: “Browse/Select Variables & Values” → Click izquierdo en “Select” → Click izquierdo en “OK” → Aparecerá la pantalla: “Confirmation” → Click izquierdo en “OK”

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

66


INSTRUCCIONES-EJERCICIO 2: (continuación) Buscar la cantidad de personas que no tienen plan médico por edad, sexo y estado civil para los periodos 2012, 2013 y 2014

Posible solución: (continuación)

Guía: Datasets: → Puerto Rico Public Use Microdata Sample → 2012, 2013, 2014 Variables:** → Person Weight: PWTGP → Age: AGEP → Sex: SEX → Health Insurance Coverage Recode: HICOV → Recoded detailed race code: RAC1P → Married, spouse present/spouse absent: MSP Geographical Zone: → Puerto Rico

Categorías:** AGEP: → Under 1 year → Between 1 and 14 → Between 15 and 24 → Between 25 and 45 → Between 46 and 64 → Between 65 and 99

Marzo 2016

RAC1P: → White alone → Black or African American alone

→ Modificar las variables (Pantalla: “DataBasket/Download/Make A Table”) → AGEP (Age) → Click izquierdo sobre la variable “AGEP” → Click izquierdo en “Recode Variable”. → Aparecerá la pantalla “Recode/Regroup Variables” → Cambiar el nombre de la variable al de su preferencia para identificar el “recode” en el recuadro que está a la izquierda de “is label for the Variable Recode of AGEP” → Click izquierdo sobre “Under 1 year”, luego click izquierdo en “Recode” → Crear las categorías de las edades, escribiendo la edad en el recuadro “Within the range from 1 through”, luego click izquierdo en “Recode”. → Realizar el mismo proceso para cada categoría de edad sugerida** → Al finalizar, hacer click izquierdo sobre “OK” → RAC1P (Recoded detailed race code) → Click izquierdo sobre la variable “RAC1P” → Click izquierdo en “Recode Variable”. → Aparecerá la pantalla “Recode/Regroup Variables” → Cambiar el nombre de la variable al de su preferencia para identificar el “recode” en el recuadro que está a la izquierda de “is label for the Variable Recode of AGEP” → Clikc izquierdo sobre cada categoría sugerida, luego click izquierdo sobre “Recode”. Cerrar la pantalla, haciendo click izquierdo en “OK” DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

67


INSTRUCCIONES-EJERCICIO 2: (continuación) Buscar la cantidad de personas que no tienen plan médico por edad, sexo y estado civil para los periodos 2012, 2013 y 2014 Guía:

Posible solución: (continuación)

Datasets: → Puerto Rico Public Use Microdata Sample → 2012, 2013, 2014

→ Crear la tabla de interés → Click izquierdo en “Make A Table” → Aparecerá la pantalla “Ferrett Tab Message”. Click izquierdo en “OK” → Aparecerá la pantalla “Ferrett Tabulation”. En ella comenzará a trasladar las variables, que aparecen en el lado derecho, a los recuadros de la hoja de trabajo → RECODE2 (Race Categories): a la C1, R2 → RECODE1 (Age Categories): a la C1, R2 → MSP: a la C1, R3 → Instances (periods per year): a la C2, R1 → SEX: a la C2, R1 → HICOV: a la C2, R1 → Click izquierdo en “ GO Get Data”

Variables:** → Person Weight: PWTGP → Age: AGEP → Sex: SEX → Health Insurance Coverage Recode: HICOV → Recoded detailed race code: RAC1P → Married, spouse present/spouse absent: MSP Geographical Zone: → Puerto Rico

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

68


Contacto del CIC: Dr. José G. Caraballo-Cueto, Director Teléfono: (787) 738-2161, extensions 2615, 2763 Internet: www.cayey.upr.edu/iii/cic Correo electrónico: cic.upr@upr.edu Localización: Residencia I-21, frente a la cancha de tenis, al lado del Programa de Estudios de Honor

Marzo 2016

DR. JOSÉ G. CARABALLO-CUETO, DIRECTOR CIC, UPR EN CAYEY

69


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.