Scrape USDA Database

  • Κατάσταση Κλειστή
  • Προϋπολογισμός $30 - $250 USD
  • Συνολικές Προσφορές 32

Περιγραφή Εργασίας

Scraping USDA 2016 database

Go to [url removed, login to view]

Scrape all the items in the database (77,413 listed):

For each page (1549 listed), grab for each item:

Information from the three columns:

“NDB. No”

“Description”

“Food Group”

From “Description”, extract the UPC code if available (leave it in the Description field too)

Go to the link of the “NDB. No” column and grab information from columns

Column 1: “Nutrient”

Column 2: “Unit”

Column 3: “Value per 100g”

Export into Excel file with

1 row per item

Columns: NDB. No, Description, Food group, UPC, and nutrition information

Note: “nutrition information” does not have a consistent format. Some items give “energy, proteins, total lipid, carbohydrates, sodium”, some give “energy, proteins, total lipid, carbohydrates, fibers, sugar, calcium, iron”, and some other might give other nutrients. Make sure to keep similar nutrients in the same column and add a column for every new nutrient found.

In the output file, similar nutrients should be put in corresponding columns. If an item does not contain information on a nutrient, the cell should be left blank (do not put a zero).

Λάβετε δωρεάν προσφορές για μία εργασία σαν αυτή
Απαιτούμενες Δεξιότητες

Ψάχνετε τρόπους για να κερδίσετε μερικά χρήματα;

  • Ορίστε τον προϋπολογισμό σας και το χρονικό πλαίσιο
  • Περιγράψτε την πρότασή σας
  • Πληρωθείτε για τη δουλειά σας

Προσλάβετε Freelancers που ήδη έχουν υποβάλει προσφορά σε αυτή την εργασία

    • Forbes
    • The New York Times
    • Time
    • Wall Street Journal
    • Times Online