martes, 19 de marzo de 2013

Fase 3

En esta fase hemos desarrollado el parser que obtiene todos los datos que queremos de www.ascodevida.com

Por ahora hemos obtenido estos datos de cada post en Ascodevida:

  • El texto del post.
  • Número de comentarios.
  • Votos    Asco de vida
  • Votos    Menuda chorrada
  • Votos    Haberlo pensado
  • Comentarios del post.

Por ahora obtenemos las 3 primeras páginas. Nos decantamos por usar una librería ( http://simplehtmldom.sourceforge.net/ ) para facilitar el parseo. Igualmente tuvimos que recurrir a las expresiones regulares para extraer algunos datos.

El mayor trabajo ha sido comprender cómo funciona la base de datos de wordpress. Ya que tiene un amplio abanico de funciones que permiten hacer querys, inserts, etc.

A continuación mostramos el enlace al informe de la práctica y el enlace al parser :

1 comentario: