O data mining, ou mineração de dados, é uma área da computação que está ganhando cada vez mais popularidade e, portanto, importância. Pensando nisso, o professor Marco Gerosa e os alunos Igor Wiese, Gustavo Oliva e Maurício Amishi, do Instituto de Matemática e Estatíca da USP, estão desenvolvendo uma pesquisa na área de mineração automatizada de informações em repositórios de software livres. Parece complicado, mas é mais simples do que parece.
A mineração de dados é utilizada para encontrar dados úteis e padrões importantes em meio um enorme número de informações. Um caso famoso foi quando uma grande rede de supermercados começou a vender cervejas e fraldas lado a lado após um software de data mining detectar que a venda do primeiro estava associado a venda do segundo. As vendas de cerveja então aumentaram cerca de 30%. O que acontecia é que, às sextas-feiras, os pais que iam comprar fraldas aproveitavam para abastecer o carrinho com cervejas também. O que o software fez foi analisar os hábitos de milhares de consumidores e achar padrões que poderiam ajudar em tomadas de decisões.
O projeto de Marco e seus alunos se aplica ao desenvolvimento de softwares livres que são desenvolvidos colaborativamente e têm seu código fonte aberto para adaptações de qualquer desenvolvedor, como o Linux e o Firefox.
O lugar onde esses dados de desenvolvimento são guardados chama-se repositório. Dessa forma, o projeto pretende fazer o mesmo que a rede de supermercados fez, porém, no armazém de dados desses softwares.
Esse projeto é extremamente importante pois ele vai trabalhar com anos de informações que são compartilhadas em fóruns por colaboradores que ajudam a criar e otimizar softwares livres. O professor Marcos e seus alunos estão criando ferramentas que possibilitam essa mineração, que pode ser útil para consertar bugs, encontrar dados de softwares antigos e acompanhar cada alteração feita por colaboradores em softwares abertos. Assim, os próprios colaboradores e desenvolvedores terão mais instrumentos para obter informações que o ajudam a desenvolver seus próprios programas e aplicativos.