accessing web archives

Creating a panel dataset of historical website information from web archives.

Create_Web_Panel
Author

Julian Oliver Dörr

urlkey timestamp url mime mime-detected status digest length offset filename
de,zew)/ 20171211154120 http://www.zew.de/ text/html text/html 200 DFB4ZBE4QT4Y7CWATCK7Q7G5SSCBQHY6 18082 508576778 crawl-data/CC-MAIN-2017-51/segments/1512948513...
de,zew)/ 20171212155354 http://www.zew.de/ text/html text/html 200 OXTU2HOXOSJ2YBYRPFDIED77WJ543HBS 17904 495470327 crawl-data/CC-MAIN-2017-51/segments/1512948517...
de,zew)/das-zew/aktuelles/gruendungen-in-baden... 20171212095717 http://www.zew.de/das-zew/aktuelles/gruendunge... text/html text/html 200 EDPWOZEBDOJ7L2A4TQ2JACYA4FXP3XKG 14557 491201284 crawl-data/CC-MAIN-2017-51/segments/1512948515...
timestamp text
20171211154120 Zentrum für Europäische Wirtschaftsforschung (...
20171212155354 Zentrum für Europäische Wirtschaftsforschung (...
20171212095717 ZEW-Aktuell: Gründungen in Baden-Württemberg m...
20171212100700 ZEW-Aktuell: Neue Daten für eine effiziente Ve...
20171211154059 ZEW-Aktuell: Schüler-Teams zum regionalen YES!...
20171213020528 ZEW-Aktuell: ZEW Wirtschaftsforum 2016 – Markt...
20171212102529 404Zur Navigation springenZum Seiteninhalt spr...
20171217114955 AnfahrtZur Navigation springenZum Seiteninhalt...
20171215102245 Aktuelle Meldungen - ZEW MannheimZur Navigatio...
20171214063116 ZEW-Aktuell: 19. ZEW Summer Workshop – Gestalt...

Conclusion