A Importância dos Dados FAIR nas Ciências da Terra

Dr. Jans Aasman15 outubro 2019
Sobre o autor: Jans Aasman é Ph.D. psicólogo, especialista em ciência cognitiva e CEO da Franz Inc., um dos primeiros inovadores em inteligência artificial e fornecedor da AllegroGraph, o principal banco de dados de gráficos semânticos.
Sobre o autor: Jans Aasman é Ph.D. psicólogo, especialista em ciência cognitiva e CEO da Franz Inc., um dos primeiros inovadores em inteligência artificial e fornecedor da AllegroGraph, o principal banco de dados de gráficos semânticos.

A avaliação dos dados como um ativo da empresa é realizada de maneira mais precisa ao longo do tempo. Quando gerenciado adequadamente, o mesmo conjunto de dados suporta uma pluralidade de casos de uso, fica quase instantaneamente disponível mediante solicitação e é intercambiável entre departamentos ou organizações para aumentar sistematicamente seu rendimento a cada implantação.

Esses benefícios de alavancar dados como um ativo da empresa são a base dos princípios de FAIR (Findable Accessible Interoperable Reusable - Reutilizável por Acessibilidade) da GO FAIR, impactando profundamente os rigores de gerenciamento de dados da ciência geológica. Numerosas organizações nesse espaço adotaram esses princípios para compartilhar rapidamente informações entre uma diversidade de disciplinas para guiar com segurança a administração da Terra.

Segundo a Dra. Annie Burgess, diretora de laboratório da Earth Science Information Partners (ESIP), “os desafios globais mais prementes não podem ser resolvidos por uma única organização. Os cientistas exigem dados coletados em várias disciplinas, que geralmente são gerenciados por muitas agências e instituições diferentes. ”Como muitos membros da comunidade de ciências da Terra estão percebendo, o meio mais eficaz de gerenciar esses dados diferentes de acordo com os princípios da FAIR é utilizando os padrões semânticos gráficos de conhecimento subjacentes.

Essas abordagens uniformes para gerenciar metadados, modelos de dados e terminologia são o cerne da movimentação de dados da FAIR, garantindo o lugar dos dados como um ativo precioso da comunidade científica.

Ciência comum
Os padrões semânticos que suportam gráficos de conhecimento são projetados para identificar, acessar e compartilhar dados de forma exclusiva em um formato legível por máquina. Eles são os mesmos padrões responsáveis por facilitar essas vantagens na World Wide Web e são imensamente benéficos para a reutilização de dados no campo da ciência geológica. Esse campo é uma das áreas científicas mais desafiadoras porque é muito extenso, abrangendo vida marinha, preocupações atmosféricas, massas terrestres e desenvolvimentos subterrâneos. A capacidade de compartilhar dados rapidamente nessas diferentes especializações é um aspecto integrante do avanço do campo como um todo, assim como as outras vantagens de identificar dados de maneira exclusiva e de acessá-los rapidamente por meio de técnicas legíveis por máquina.

Observou o Dr. Lewis McGibbney, cientista de dados do Laboratório de Propulsão a Jato do Instituto de Tecnologia da Califórnia e co-presidente do Grupo de Trabalho de Relevância de Pesquisa ESDSWG da NASA: “Estamos em um estágio empolgante para onde há uma massa crítica de especialistas e organizações em todo o mundo. com objetivos semelhantes, bem como a constatação de que precisamos de aplicativos intensivos em conhecimento. A pilha de tecnologia semântica é uma peça crucial para a criação de aplicativos inteligentes para casos de uso com uso intensivo de conhecimento na área de geociência. ”Além disso, os padrões semânticos permitem que essas organizações publiquem dados e descobertas em um formato reutilizável, para que diferentes organizações se beneficiem diretamente do trabalho uma da outra.

Vinculando seres humanos e máquinas
A abordagem FAIR gira em torno da vinculação de diferentes partes de dados em um gráfico de conhecimento. Esses gráficos de conhecimento, por sua vez, podem ser vinculados entre diferentes organizações ou "publicados" na Web para acesso universal - o que é fundamental para a interoperabilidade. Essa abordagem não apenas exige que cada dado individual tenha seu próprio identificador exclusivo, mas também uma descrição rica de seus metadados com base em vocabulários e taxonomias padronizados, rapidamente entendidos e acessados via máquinas. Modelos de dados semânticos (ontologias) padronizam diferenças inerentes no esquema usadas por diferentes organizações para diferentes aplicativos, ajudando ainda mais a interoperabilidade dos sistemas de TI que adotam os princípios FAIR.

Carlos Rueda, engenheiro de software sênior do Instituto de Pesquisa do Aquário de Monterey Bay, comentou que “o Projeto de Interoperabilidade de Metadados Marinhos desenvolveu o MMI Ontology Registry and Repository (ORR), que aproveita o AllegroGraph para fornecer serviços semânticos interoperáveis poderosos que tornam o conteúdo na Web interconectado de maneira significativa para humanos e máquinas consumirem. ”Ao permitir que diferentes organizações científicas do Projeto de Interoperabilidade de Metadados Marinhos registrem ontologias de seus inúmeros repositórios dessa maneira padronizada, a integração e acessibilidade de dados são aceleradas.

Diversidade Unificada
Talvez a vantagem capital de ativar os princípios FAIR com gráficos de conhecimento na comunidade de ciências da terra seja a capacidade de padronizar a variedade de dados de diversos mergulhadores relevantes para os cientistas. O grande número de diferentes especializações nesse campo requer dados de variedades aparentemente infinitas. As fontes incluem dados do sensor de água, fontes aéreas e terrestres, além de dados de satélite e dados de amostras físicas. Além disso, esses dados são caracterizados por diversas resoluções espaciais e temporais, aumentando a complexidade geral de gerenciá-las de maneira homogênea. A esse respeito, os modelos de dados semânticos são consideravelmente ajudados por vocabulários uniformes para descrever dados. O Dr. Burgess fez alusão ao mérito do "Repositório de Ontologia da Comunidade ESIP, uma plataforma da comunidade para gerenciar e trocar termos e vocabulários que ajudam os cientistas a publicar, descobrir e reutilizar dados".

Propagação a Longo Prazo
Como revelam os abundantes casos de uso dentro da comunidade de ciências geológicas, a verdadeira estima dos dados é baseada em sua reutilização duradoura e acessibilidade imediata. Essas prioridades geraram o movimento FAIR, que depende de tecnologias semânticas para implementação. Essa abordagem oferece o mesmo benefício quando aplicada a organizações contemporâneas: um aumento no valor dos dados como um ativo da empresa.

Sobre o autor
Jans Aasman é Ph.D. psicólogo, especialista em ciência cognitiva e CEO da Franz Inc., um dos primeiros inovadores em inteligência artificial e fornecedor da AllegroGraph, o principal banco de dados de gráficos semânticos. Como cientista e CEO, o Dr. Aasman continua a inovar nas áreas de Inteligência Artificial e Gráficos de Conhecimento, trabalhando lado a lado com inúmeras organizações da Fortune 500, além de governos dos EUA e de outros países. O Dr. Aasman passou grande parte de sua carreira profissional, especializando-se em projetos de Inteligência Artificial aplicados, interfaces de usuário inteligentes e pesquisa em telecomunicações. Ele reuniu patentes nas áreas de tecnologia da fala, interação multimodal do usuário, mecanismos de recomendação enquanto desenvolvia a tecnologia precursora para tablets e assistentes pessoais. Ele foi professor no departamento de Desenho Industrial da Universidade Técnica de Delft e notável palestrante em eventos como Smart Data, NoSQL Now, International Semantic Web Conference, GeoWeb, AAAI, Enterprise Data World, Global Graph Summit, Text Analytics, e TTI Vanguard.