Page 13

USAID Crowdsourcing Case Study  

Workflow The Crowd’s Task  As mentioned previously, the DCA database is structured in such a way that all geographic information is  stored in a single field (labeled “City/Region” in the original database and later changed to “Original  Location” for processing) and not standardized across all records (see example below). Sometimes the city is  given, sometimes a street address, and sometimes only the first administrative (or “state”) level is provided.  To resolve this problem that had arisen from manual data entry, the information had to be broken out into  different fields to be mapped at the lowest level of granularity across all records. Once parsed out, the place  name would be used to capture the first administrative level unit by using a gazetteer such as GNS.  Because a DCA record often contains an Admin1 name and a city/town name within the Original Location  field, it was deemed feasible to develop an automated process that used a computer script to parse out the  Admin1 name and/or place names and validate them against an authoritative database. The script first  looked for matches for place names and Admin1 names against the NGA database. If no match was found,  the text of Original Location was entered into the Google Geocoding API to see if it would return an Admin1  name that was valid in the GNS database. The roughly 10,000 remaining records – representing the most  complex and/or partial data would require human processing by way of the Crowd.  Fig. 1 The “original location” column would be used to fill in the proceeding columns and the status  updated accordingly:  Status  Country  Original Location 

Admin 1  Admin 1 Code 

place name 

Assigned Vietnam 

Mac Thi Buoi Ward, Wi Kan Gam Dist Ha Noi  Viet Nam 

Assigned Haiti 

Port au prince 

Assigned Haiti 

Sud

Assigned Paraguay  ### calle, campo #### 

Would then become…   

Status

Country Original Location 

Admin 1  Admin 1 Code  place name 

Completed

Vietnam

Mac Thi Buoi Ward, Wi Kan Gam Dist Ha Noi  Viet Nam 

Ha Noi

VM44

Ha Noi

Completed

Haiti

Port au prince 

Ouest

HA11

Port au prince

Completed

Haiti

Sud

Sud

HA12

Bad Data 

Paraguay ### calle, campo ####

10

Crowdsourcing to Geocode Development Credit Authority Data: A Case Study  

Crowdsourcing: A case study.

Crowdsourcing to Geocode Development Credit Authority Data: A Case Study  

Crowdsourcing: A case study.

Advertisement