O projeto, coordenado por Nina Hirata, faz parte do Núcleo de Pesquisa em eScience da USP, que fica localizado no Instituto de Matemática e Estatística. Como o próprio nome revela, ele tem a função de fornecer rapidez ao processo matemático. Para isso, o sistema reconhece expressões escritas à mão. O propósito dos desenvolvedores é estudar algarismos e métodos para a recognição dos termos algébricos.
A ideia principal é a construção de expressões modelo previamente definidas. Os usuários, então, as transcrevem, e a partir daí o sistema passa a identificar cada símbolo e buscar correspondência na base de dados. Assim, todas as informações inseridas no programa podem ser transferidas automaticamente ao novo problema. Passando a ser uma combinação simples. Isso evita que os projetistas tenham que escrever os ícones isoladamente (uma tarefa cansativa), já que diversas amostras de símbolo podem ser obtidas de um único modelo. Os resultados comprovaram uma taxa de associação correta de pelo menos 99%.
O problema revela complexidade na medida em que é preciso estudar uma variedade de padrões de escrita, notações, ambiguidades e símbolos, incluindo caracteres, numerais, parênteses. Um classificador completo deve reconhecer aproximadamente dois mil símbolos. Além disso, existem ícones semelhantes, compostos por poucos traços e sem muita diferenciação entre si. Por exemplo, um traço horizontal pode ser um sinal de subtração ou indicar uma fração. Por outro lado, existem várias comunidades matemáticas, cada uma com a sua própria convenção, o que prejudica a elaboração de um método que atenda a todos os padrões. Isso pode se materializa no tempo de desenvolvimento do programa, que ainda não está finalizado; tendo sido iniciado no ano de 2006.
Créditos: William Honda
O software pode ser útil ao digitalizar documentos escritos e ao assistir portadores de deficiência visual a ler notações algébricas, entre outras aplicações. Há uma combinação da escrita com a capacidade de processamento dos computadores.
O ExpressMatch foi concebido para ajudar na criação e administração de dados para expressões algébricas online. O reconhecimento com uso da Internet permite a captação da distribuição espacial dos traços e também informações temporais associadas a eles. Por esse vínculo com o tempo, este último tende a apresentar um melhor desempenho que a verificação offline.
Os estudiosos notaram que é necessário o aprimoramento do espaçamento e alinhamento entre os símbolos dos termos, como na disposição de numeradores e denominadores em relação à fração. Algoritmos podem ser aplicados para amenizar ou eliminar as irregularidades estruturais, delimitando um espaço entre os símbolos. Este é um dos pontos que estão trabalhando. A resolução aperfeiçoa a segmentação e reduz erros.
Além disso, Aguilar aponta que há uma pretensão em extender o método para ajudar na criação de bancos de dados de outros tipos de notações manuscritas, em equações químicas, por exemplo.
Coleta de expressões no ExpressMatch. Créditos: William Honda.