Van website naar data naar content!

Welkom op de website van Data-extract. Data-extract is gespecialiseerd in de ontwikkeling en verrijking van datafeeds door het ontrekken van informatie uit webpagina's (Web Content Extractie).
Met informatie bedoelen we hier gestructureerde gegevens die (meestal dynamisch) op een website worden aangeboden, bijvoorbeeld: producten in een webwinkel, huizen op een makelaars website, vluchtaanbod van een luchtvaartmaatschappij, banenaanbod op een vacature website, enz. enz. Eigenlijk bijna alle gegevens die vanuit een database op een webpagina worden getoond.

Afhankelijk van de techniek en structuur van de website kunnen de aanwezige gegevens uit de (HTML) content worden onttrokken en weer worden opgeslagen in een bestand, dit bestand (of downloadstream) is daarna bruikbaar voor invoer op andere gegevensbronnen (databases) of direct op webpagina's (XML met XSLT).

Voor een extractie bouwen wij met behulp van reguliere expressies een 'spiderscript' dat is gebaseerd op de structuur van de betreffende website. Deze spider kan dan van pagina tot pagina door de content 'crawlen' en de gewenste informatie meenemen en opslaan. Dit proces eindigt wanneer de laatste pagina is bereikt. Uiteindelijk is er een bestand ontstaan waarin alle 'onttrokken' informatie is opgeslagen. Dit bestand is vervolgens direct beschikbaar voor verdere distributie via een downloadlink. Het bestand kan periodiek opnieuw worden opgebouwd met frequenties die de opdrachtgever wenst.


Affiliate marketing

Data-extract is in het bijzonder betrokken bij de ontwikkeling van affiliate datafeeds. Dit zijn bestanden met informatie uit een webwinkel die door affiliates en webmasters gebruikt kunnen worden om producten te verkopen tegen een bepaalde vergoeding in de vorm van commissie (performance-based marketing). Hiervoor werken wij o.a. nauw samen met performance advertising network Zanox gevestigd in Amsterdam. Het is mogelijk om zowel nieuwe feeds te ontwikkelen als het verrijken van bestaande feeds met data die niet of moeilijk vanuit de database kan worden mee gegeven. Voor meer informatie kunt u hier terecht: partner netwerken.