![]() |
|
|
#1 |
|
Neuer Benutzer
|
Hi Leute,
vielleicht könnt ihr mir weiterhelfen. Ich bin Student der Geographie in Kiel und versuche schreibe zur Zeit an einer Semesterarbeit zum Thema "Nationale Vernetzung und Cooperation von Webshops", also Wirtschaftsgeographie. Dazu habe ich einen Online Fragebogen entwickelt, den ich an Webshops senden will und anhand der beantworteten Bögen möchte ich dann eine Experten/Spezialisten-Analyse durchführen. Nun zu meinem Problem: Ich habe eine tolle Liste von Webshops im Internet gefunden: http://www.trustedshops.de/profil/ Wenn man dort auf einen Shop klickt, bekommt man alle relevanten Angaben, die ich benötige (Anschrift mit PLZ und Ort, URL, E-Mail, Shopname, Telefonnummer, Fax). Nun habe ich die Macher von Trustedshops angschrieben und wie erwartet geben sie keine vollständige Liste aus.... Nun sagte mir ein Freund, dass man doch ein Programm schreiben kann, womit man diese Daten automatisch auslesen und in eine Excel-Tabelle schreiben kann. Ist dies wirklich möglich? Könntet ihr mir da weiterhelfen, denn programmieren kann ich leider nicht. Mit freundlichen Grüßen Florian Schulze |
|
|
|
|
|
#2 |
|
-vidatu
|
Hey,
Ja das ist möglich. Man nennt ein solches Vorgehen "eine Website crawlen". Ein Script liest den HTTP Response und meist wird dann via eines kleinen Algorithmus und Regular expressions die Benötigte Information daraus "gecrawled". Dass dir wer für Lau einen Crawler schreibt kannst du aber nicht erwarten ;-) Abgesehen davon ist Crawlen in Deutschland so weit ich weiß illegal. Regards, Asto.
__________________
"Immaturity is the incapacity to use one's intelligence without guidance of another." Immanuel Kant Sapere Aude! Geändert von Asto (08.07.2008 um 11:50 Uhr). |
|
|
|