Python Brasil [10]

Talk "Crawling Massivo"

by Felipe Cruz .

Meta

Trilha: Other
Nível da audiência: Intermediário
Idioma: Português
Estado: Aceita

Palestrantes

Felipe Cruz

Desenvolvedor de software há 10 anos, entusiasta de software livre. Trabalhando em rede há 2 anos e atendendo diversos tipos de clientes desde programação, arquitetura até bootstraping de times de desenvolvimento. Atualmente terminando o mestrado na PUC-Rio em machine learning com foco em computação financeira.
Twitter: @felipejcruz

Descrição

Extrair informações de páginas web pode permitir a criação de diversos negócios ou pode ser extremamente estratégico para empresas ou pessoas. A idéia dessa palestra é ver técnicas de scrapping e crawling massivo usando ZeroMQ para distribuir carga e sincronizar o trabalho de quantos workers forem necessários. Além disso, vamos ver alguns números e valores para pegar quantidades grandes de informação e entender qual a relação entre o tamanho da informação e o custo de se obte-la o mais rápido o possível.