quarta-feira, 6 de setembro de 2017

O 4o Paradigma de Jim Gray - a eScience

O 4o Paradigma de Jim Gray, chamado de eScience, vê a Ciência como uma exploração de dados, unificando teorias, experimentos e simulações. As ferramentas permitem analisar grandes volumes de dados, capturados por instrumentos e sensores ou gerados por simuladores, usando processadores paralelos e estatística, a fim de unificar teorias, explicar resultados de experimentos e simulações e ajudar na construção de novos modelos.

Milhares de anos atrás, a ciência era empírica, descrevendo apenas fenômenos naturais. Este foi o 1º Paradigma. Por exemplo, o método da sangria era experimentação pura, uma espécie de tentativa e erro (ou, faça e veja o que acontece). E isto durou até a Renascença e o Iluminismo. Hoje temos tecnologias para coleta de dados que incluem sensores, câmeras e Internet das Coisas (IoT). Podemos armazenar dados não estruturados como imagens, sons e textos.

Há poucas centenas de anos, ramos teóricos surgiram usando modelos e generalizações. Este foi o 2º Paradigma. Com ele, surgiram as leis da Física e outras equações e teorias que explicam os fenômenos observados e podem prever eventos futuros. Hoje temos tecnologias como BI e Data Mining que podem ajudar a encontrar padrões estatísticos e modelos matemáticas de forma quase automática. Softwares de predição podem ajudar a predizer eventos ou valores numéricos usando modelos e equações matemáticas.  

Com o avanço dos computadores e do software (por exemplo, processamento paralelo e inteligência artificial), foi possível elaborar teorias complexas e testá-las com simulações computacionais. Este é o 3º Paradigma. Imagine poder testar a divulgação e a venda de novos produtos da seguinte forma: se fizermos um post no Facebook para 1000 pessoas, se uns 20% compartilharem, se 2% dos que receberem a postagem comprarem o produto, se 10% dos que comprarem divulgarem, e se etc etc. qual será o resultado final ?

O 4º Paradigma, a eScience, é um processo de exploração massiva de dados, combinando a identificação e uso de teorias, observações e experimentos e a simulação computacional.


Fonte: HEY, Tony, TANSLEY, Stewart, TOLLE, Kristin Tolle (Editores). The Fourth Paradigm: Data-Intensive Scientific Discovery. Microsoft Research, 2009.