Resumo: Este artigo apresenta e descreve uma metodologia de organizaçâo e representaçâo do conhecimento de temas de pesquisa, cuja execuçâo permite o alinhamento de várias ferramentas objetivando sistemas de organizaçâo de conhecimento como recurso para facilitar a elaboraçâo de sistemas de conceitos, expressoes de busca e significaçâo da informaçâo recuperada em bases de dados. A metodologia proposta se constitui de quatro etapas, baseadas em métodos e técnicas de: mapeamento do dominio do conhecimento; codificaçâo do conhecimento; aplicaçâo de linguistica de corpus e de processamento de linguagem natural e representaçâo do conhecimento. Um exemplo prático é apresentado sobre o dominio temático da inteligencia artificial na educaçâo, a partir da recuperaçâo dos metadados de uma pesquisa bibliográfica na base Scopus. Em seguida, é realizada a análise da rede de coocorrencia de palavras-chave, que revela o espaço conceitual que emerge da literatura recuperada.
Palavras-chave: mapeamento do conhecimento; organizaçâo do conhecimento; representaçâo do conhecimento; espaços conceituais; inteligencia artificial na educaçâo.
Abstract: This article presents and describes a methodology of knowledge organizing and representing of research themes, whose execution allows the alignment of several tools aiming, systems of knowledge organization as a resource to facilitate the elaboration of concept systems, search expressions and information signification recovered from databases. The proposed methodology consists of four steps based on methods and techniques of: mapping the knowledge domain; knowledge codification; linguistic corpus applications and natural language processing; and knowledge representation. A practical example is presented about the thematic domain of artificial intelligence in education, based on the retrieval of bibliographic metadata from the Scopus database. Then, the analysis of the keyword co-occurrence network is performed, revealing the conceptual space that emerges from the retrieved literature.
Keywords: knowledge mapping; knowledge organization; knowledge representation; conceptual spaces; artificial intelligence in education.
1.Introduçao
Na era do conhecimento, os processos de pesquisa, desenvolvimento e inovaçao, devido ao alto grau de complexidade e multi, inter e transdisciplinaridade temática, tem sido executados, cada vez mais, por meio das chamadas redes de conhecimento (Torres, Pierozzi, Pereira & Castro, 2011). Boa parte do conhecimento gerado nessas redes costuma ser explicitado em linguagem natural e, via de regra, textualmente, constituindo um volume enorme de documentos impressos ou digitais. Neste último formato, os documentos sao disponibilizados amplamente em ambiente Web ou bases de dados, cujo acesso é facilitado pelas tecnologías da informaçao e comunicaçao (TIC).
Os mapas semánticos, construidos por meio de análises de coocorrencia de palavras, sao usados para entender a estrutura cognitiva de um dominio do conhecimento (Cahlik, 2000; Salvador & Lopez-Martinez, 2000). Esses mapas sao gerados a partir de diferentes fontes textuais, incluindo palavras extraídas de títulos de artigos, palavras-chave declaradas pelos autores ou descritores atribuidos pelo editor, que estao registrados e indexados em bases de dados como a Elsevier Scopus e a Clarivate Web of Science. Atualmente, essas bases oferecem excelentes recursos bibliométricos para os usuários interessados em exploraçao e reuso de dados, informaçoes e conhecimento.
O poder computacional para recuperaçao e análise desses conteúdos está prontamente disponível para os usuários analisarem redes com grandes quantidades de documentos (Zhao & Strotmann, 2008). Por outro lado, grande quantidade de informaçao requer o uso de ferramentas avançadas para viabilizar sua análise (Shiffrin & Börner, 2004), organizaçao e sua ressignificaçao em outros contextos.
Historicamente, essas soluçoes nao surgiram sem grande esforço. Dada a falta de recursos de computaçao, os primeiros estudos, naturalmente, tendiam a se concentrar em pequenas iniciativas e foram, com algumas exceçoes, académicos por natureza. No entanto, o esforço para analisar grandes quantidades de documentos e obter respostas diminuiu consideravelmente, acompanhando o aumento da disponibilidade de dados em formato digital e o aumento exponencial do poder computacional, que incluem algoritmos avançados para visualizaçao da informaçao e análises qualitativas.
Essas práticas configuram as chamadas competencias analíticas (Levine, StrotherGarcia, Hirsh-Pasek, & Golinkoff, 2017) de uma organizaçao e representam o conjunto de metodologias e ferramentas para reuniao e análise de grandes volumes de informaçao com objetivo de criaçao de inteligencia1. Atualmente, as competencias analíticas resgatam um referencial teórico e metodológico multidisciplinar, que envolve, entre as principais abordagens, temas como visualizaçao da informaçao, sistemas de organizaçao do conhecimento (SOC), mineraçao de dados e de textos, processamento em linguagem natural (PLN), linguística de corpus e terminologias, mapas e estruturas conceituais, além de modelagens matemática e estatística.
O objetivo deste artigo é apresentar e descrever uma metodologia de mapeamento de dominios de conhecimento, cuja execuçao permite o alinhamento de varias ferramentas tendo-se como resultado, sistemas de organizaçao de conhecimento como recursos para facilitar a elaboraçao de sistemas de conceitos, expressoes de busca e significaçao da informaçao recuperada. O texto está estruturado, após esta breve introduçao, com o referencial teórico, que aborda os principais conceitos que sustentam o trabalho, com a metodologia proposta, um exemplo prático, conclusoes e referencias bibliográficas.
2.Referenciái Teórico
Sistemas de organizaçao do conhecimento (SOC) se referem a um termo genérico usado para abordar uma ampla gama de itens (taxonomías, tesauros, esquemas de classificaçao e ontologias), que foram concebidos com diferentes propósitos, em momentos históricos distintos. Os SOC sao caracterizados por diferentes estruturas e funçoes específicas, variados modos de se relacionar com a tecnologia e empregados em uma pluralidade de contextos por diversas comunidades. No entanto, o que todos eles tem em comum é o fato de terem sido projetados para apoiar a organizaçao do conhecimento e da informaçao visando facilitar o gerenciamento e a recuperaçao. Para torná-lo acessível e utilizável (por agentes humanos ou tecnológicos), o conhecimento precisa, de fato, ser organizado de alguma maneira (Soergel, 2008), algo que, dada a grande quantidade de produçao científica e cultural, tornou-se cada vez mais importante nos últimos anos.
A visualizaçao de dominios do conhecimento tem como objetivo revelar as áreas da comunicaçao científica, conforme refletidos na literatura científica publicada e nas trajetórias de citaçao realizadas por pesquisadores em suas publicaçoes. Há de fato uma conexao importante entre a visualizaçao de dominios e o que Hjørland (1997) chamou de análise de domínio. A visualizaçao fornece técnicas de habilitaçao para análise de dominio, especialmente em áreas de conhecimento multidisciplinares e de rápida evoluçao. O campo de visualizaçao de domínio também tem sido chamado de cientografia (Garfield, 1994), embora este termo nao pareça ser amplamente utilizado.
Os avanços na visualizaçao da informaçao tem sido significativamente impulsionados pela pesquisa de recuperaçao de informaçao, cujo problema central tem sido como melhorar a sua eficiencia e a sua eficácia. De um modo geral, quanto mais um usuário souber sobre seu espaço de pesquisa, maior será a probabilidade de sua pesquisa ser eficaz. Muitos sistemas de visualizaçao de informaçoes descrevem a estrutura semántica geral de uma coleçao de documentos. Os usuários podem usar essa visualizaçao estrutural como base para navegaçao e pesquisa subsequentes.
A seleçao de uma unidade de análise é o passo inicial para explorar qualquer dominio do conhecimento, seguido pelas perguntas a serem respondidas. Essa premissa do processo vai ao encontro do espaço conceitual de Gärdenfors (2014). Este autor forneceu caracterizaçoes precisas de várias categorias ontológicas tais como: um objeto é representado por uma sequencia de pontos em um conjunto de espaços conceituais; uma propriedade por uma regiăo em um espaço conceitual; um conceito por uma sequencia de regioes em um conjunto de espaços conceituais.
As unidades de análise mais comuns no mapeamento de literatura sao periódicos, documentos, autores e termos descritivos ou palavras-chave. Cada um apresenta diferentes facetas de um domínio e facilita diversos tipos de análise. Por exemplo, um mapa de periódicos pode ser usado para obter uma visao macro da ciencia (Bassecoulard & Zitt, 1999), mostrando as posiçoes relativas e as relaçoes entre as principais disciplinas.
Em muitas situaçoes, as pessoas utilizam palavras com a finalidade de pesquisar assuntos, conceitos ou ideias. A intençao é recuperar informaçoes que possibilitem o entendimento conceitual a partir do significado das relaçoes que se estabelecem com os termos recuperados na pesquisa. A análise dos dados oriundos de metadados dos documentos indexados em uma base de referencias bibliográficas torna-se essencial para gerenciar, localizar, interpretar ou usar outros dados ou uma fonte desses dados. Os metadados de uma referencia bibliográfica nao residem no objeto de informaçao, mas no seu relacionamento com outro objeto informacional e, mais especificamente, no seu uso. Nesse sentido, a organizaçao do conhecimento se destina a atender as seguintes necessidades (Soergel, 2008): apoiar o pensamento, a construçao de sentido, a integraçao do conhecimento e a descoberta de novos conhecimentos e lacunas por pessoas e programas de computador; fornecer um roteiro semántico para um individuo e promover o entendimento compartilhado, melhorar a comunicaçao em geral e a colaboraçao; apoiar a aprendizagem e a assimilaçao de informaçao; suportar a exibiçao significativa e bem estruturada de informaçoes; fornecer a base conceitual para sistemas baseados em conhecimento; suportar interoperabilidade sintática e semántica e a preservaçao de significado ao longo do tempo; fornecer informaçoes sobre termos, conceitos e outras entidades a leitores, escritores e tradutores para ajuda-los a compreender o texto, a conceituar um tópico e a encontrar o termo adequado.
Contudo, os métodos e as tecnologías de visualizaçao de dados e informaçoes e de análise de redes podem ser associados a estudos bibliométricos e cientométricos e se revelam muito eficazes em processos de recuperaçao da informaçao e de descoberta de conhecimento em corpora textuais.
Devido ao enorme volume de dados e informaçoes publicado e disponivel atualmente, ferramentas computacionais para o mapeamento, a organizaçao, a representaçao, a análise e o reuso desses conteúdos documentais tem sido desenvolvidas e embutidas em metodologias que abrangem busca e recuperaçao de informaçoes, análises quantitativas e qualitativas, categorizaçoes e classificaçoes de assuntos, de tópicos ou de temáticas. Assim, como as redes sociais que os produzem, dados, informaçoes e conhecimento podem, igualmente, ser organizados em redes ou sistemas de conceitos. Esse processo envolve as premissas que conteúdos informacionais podem ser representados pelos conceitos ali incluidos, que, por sua vez, podem ser representados pelos termos que os denotam, conforme a Teoria do Conceito (Dahlberg, 1978). Finalmente, os termos e suas inter-relaçoes num conteúdo textual, primariamente frequencia e coocorrencia, podem ser mapeados no formato de redes, constituindo um sistema de conceitos, inclusive com atribuiçoes semânticas para qualificar tais relaçoes.
O campo de visualizaçao de informaçao avançou muito nos últimos anos, trazendo novas técnicas para a análise gráfica da literatura, de patentes, de genomas e outros tipos de conteúdos informacionais (Chen & Song, 2017). No entanto, é preciso lembrar que, enquanto a visualizaçao pode ser crítica para o entendimento e a cogniçao humanos, ela é simplesmente uma janela para as análises rigorosas, muitas vezes multidimensional que formaram a base da informática por muitos anos. Nesse sentido, o mapeamento nao se refere apenas a tela de visualizaçao, mas também as técnicas subjacentes de mineraçao, análise de dados e reconhecimento de padrees ou propriedades específicas dos elementos que compoem o sistema conceitual envolvido. Mapear dominios de conhecimento, entao, toma como sua entrada assuntos aparentemente diversos de análises, incluindo e integrando: análises de redes (por exemplo, web, redes sociais, redes livres de escala e caminhos metabólicos); linguísticas; conceituais (dominio, conteúdo, discurso, assunto); de extraçao de tópicos; de citaçoes, coautorias, coocorrencia de palavras-chave; indicadores (metadados) de ciencia e tecnología; técnicas de visualizaçao.
O principal objetivo do mapeamento de dominios de conhecimento é fornecer subsidios de análise para o especialista quanto para o nao-especialista. Para o nao-especialista, o mapeamento fornece um ponto de entrada em um dominio, por possibilitar a obtençao de conhecimento nos níveis macro e micro. Para o especialista, o mapeamento fornece uma validaçao de percepçoes e um meio de investigar rapidamente tendencias e novas informaçoes, incoerencias e divergencias, tanto quanto convergencias. No entanto, até mesmo o especialista pode se surpreender com os desenvolvimentos na periferia de sua percepçao. O mapeamento e a exploraçao interativa fornecem contextos para tais surpresas.
Vários métodos de mapeamento, organizaçao e representaçao do conhecimento partem da lógica que nao existe gestao do conhecimento, mas, na prática, o que se conduz é uma variedade de atividades de trabalho que viabilizem o compartilhamento de informaçoes (Wilson, 2002). Dessa forma, enquanto representante convencional do conhecimento explicitado, o documento é a unidade de análise mais comum, porque pode ser usado para mapear um campo científico ou técnico específico e o seu desenvolvimento. Cocitaçao e coocorrencia de termos sao os dois tipos mais comuns de análise, e muitas vezes levam a diferentes agrupamentos. Nos níveis mais refinados, as técnicas de cocitaçao agrupam documentos por paradigma científico, ou pela mesma questao de pesquisa e hipóteses, ao passo que as comunidades de coocorrencia de termos sao de natureza mais tópica.
O mapeamento em redes de termos de indexaçao revela a estrutura cognitiva de um campo (Callon & Law, 1983). Há algum debate sobre se a análise conjunta deve ser usada para estudos de dinámica da ciencia (Leydesdorff, 1997). As abordagens mais confiáveis visam combinar técnicas de palavras coocorrentes com análises de citaçoes (Noyons, Moed & Luwel, 1999). Técnicas mais avançadas, usando algoritmos sofisticados para agrupar e relacionar tópicos, sao uma grande promessa para estudos dinámicos (Griffiths & Steyvers, 2004; Erosheva, Fienberg & Lafferty, 2004).
3.Metodologia para o mapeamento conceitual
Este item apresenta a metodologia proposta para o mapeamento conceitual de domínios de conhecimento (Moresi, Pierozzi Júnior, Oliveira, & Brandao, 2019) e no item 4 é apresentado um exemplo utilizando o tema inteligencia artificial na educaçao.
Questoes como gestăo da informaçao e do conhecimento, descoberta de conhecimento, inteligencia e planejamento estratégicos e estudos de prospecçao antecipativa passaram a ser relevantes no desenvolvimento institucional das organizaçoes, independente dos setores aos quais elas se vinculam (governamentais, académicos, terceiro setor, entre outros). Essa onda de crescentes e diversos interesses, objetivos e estratégias institucionais se converte no insumo principal para a sistematizaçao proposta no modelo descrito na Figura 1, visando o mapeamento, a organizaçao e a representaçao de dominios de conhecimento específicos.
O processo se constitui de quatro etapas: mapeamento do dominio do conhecimento; codificaçao do conhecimento; aplicaçao de linguística de corpus e de processamento de linguagem natural; e representaçao do conhecimento.
O mapeamento do dominio do conhecimento se refere a definiçao do espaço do conhecimento humano a ser modelado no processo. No entanto, isso nao significa um corte e um isolamento desse dominio de conhecimento: tal delimitaçao é um exercicio conceitual para identificaçao e reconhecimento da temática a ser explorada e posterior análise de contextos, propósitos, estratégias, tendencias, oportunidades, desafios, etc., vinculados a essa temática. Essa etapa pode ser executada a partir de escolha pessoal das temáticas ou envolver equipes de trabalho, por meio de dinámicas sociais presenciais ou virtuais. Os dados podem ser coletados por meio de técnicas como brainstormings, entrevistas, questionários, leituras, entre outras.
A codificaçao do conhecimento se refere a conversao do conhecimento tácito um formato explícito, específicamente, em "textualizaçao", ou seja, transposiçao de áudios, videos ou qualquer outro formato em que o conhecimento tenha sido registrado, para um formato textual, reunindo o maior conteúdo possivel referente as temáticas que ainda nao se apresente nessa forma como, por exemplo, as discussoes socializadas em sessoes de brainstormings ou painéis. Nessa etapa, utilizam-se técnicas diversas de registro, documentaçao e transcriçao e sao reunidos os documentos que comporao o corpus a ser processado na etapa que se segue.
Na sequencia, as aplicaçoes de linguística de corpus e de processamento de linguagem natural se realizam em tres fases: construçao, compilaçao e limpeza dos documentos selecionados para a composiçao do corpus textual para análise. Essa fase também inclui:
- a transformaçao de arquivos PDF ou em outros formatos, para o padrao TXT, que é o mais adequado ao processamento computacional utilizado nas fases seguintes;
- a extraçao semiautomática de candidatos a termos com o emprego de softwares contendo algoritmos para essa extraçao com base em métricas de frequencia e coocorrencia de palavras ou expressoes (n-gramas) no corpus, utilizando o software VOSviewer;
- o mapeamento terminológico em que se recomenda um alinhamento terminológico dos candidatos a termos obtidos na fase anterior com recursos léxicos disponíveis e referentes as temáticas definidas para a análise.
A representaçao do conhecimento se propoe a produzir os artefatos explicitados textualmente. Recomenda-se novamente uma validaçao pelos especialistas de dominio, pois a intençao é gerar os produtos finais do processo de modelagem e análise. Duas fases podem ser executadas tanto em sequencia como de forma independente uma da outra:
- desenvolvimento e aplicaçao de sistemas de organizaçao do conhecimento que se refere a elaboraçao de um formato de representaçao diferente do textual linear. Dessa forma, desde formatos unidimensionais, como listas de termos, até os mais elaborados em estrutura e funcionalidade, como as ontologias, podem ser elaborados. Nessa fase, ainda, desenvolvem-se aplicaçoes dos SOC para diversos processos de Gestao da Informaçao e do Conhecimento como, por exemplo, taxonomias navegacionais multifacetadas, que podem ser empregadas na construçao de expressoes booleanas de busca em bases de dados ou, ainda, estruturas conceituais como as redes semánticas que podem ser representadas no software yEd (yWorks, 2019);
- execuçao de gestao terminológica com o emprego de ferramentas e técnicas de gestao terminológica como, por exemplo, identificaçao de contextos visando definir os termos associados a temática delimitada no início do processo. O software livre e-Termos (Oliveira, 2009) é recomendado pois foi construido específicamente para esse fim, incluindo a operacionalizaçao de praticamente todas as 4 etapas deste processo. Além disso, o e-Termos também atende as funcionalidades de um repositório de dados terminológicos.
Adicionalmente, alguns pontos específicos de operacionalidade do processo descrito acima, merecem um olhar mais atencioso: na escolha das tecnologias de suporte ao processo, baseados no exercício empírico de realizaçao de mapeamento, organizaçao e representaçao do conhecimento, algumas ferramentas metodológicas e alguns softwares revelaram-se bastante adequados.
O software VOSviewer tem se revelado muito satisfatório, oferecendo excelentes funcionalidades de ediçao e visualizaçao de sistemas de conceitos. O bom desempenho de extraçao automática de termos deve ser atestada pelos especialistas de dominio que reconhecem nos termos propostos pelo software as formas lexicais apropriadas para os conceitos, referendando a Teoria do Conceito (Dahlberg, 1978), que embasa a concepçao do processo aqui apresentado. Além disso, o software que se propoe a elaborar graficamente um panorama do dominio analisado, fornece métricas associadas a terminologia que viabiliza análises e abordagens relacionadas a análise de redes (centralidades, comunidades) e as geometrias do conhecimento, mais específicamente aos conceitos recentes de "espaço conceitual" (Gärdenfors, 2014) e "esfera semántica" (Lévy, 2011).
O VOSviewer, além das funcionalidades de organizaçao e visualizaçao de dados e informaçoes, exporta os dados numéricos em formatos interoperáveis o que viabiliza, a partir dos arquivos de mapa de termos e de arestas para reconstruir as triplas "conceitorelaçao-conceito" do sistema de conceitos gerado.
A rede pode ser importada para o software yEd, que possibilita a representaçâo visual original obtida no VOSviewer e a ediçao no formato de grafos com inclusăo/exclusăo de termos/conceitos (nós) e de relacionamentos (arestas) e, igualmente pode ser visualizada por meio de variados layouts que proporcionam novos insights cognitivos. Outra funcionalidade muito útil do yEd é a possibilidade de elaborar recortes do sistema de conceitos, mais uma vez motivando outros insights cognitivos e empoderando o processo aqui apresentado na construçao de ressignificaçao dos dados e informaçoes ou, em outras palavras, na construçao de inteligencia.
4.Exemplo prático
Atualmente, a educaçao emprega vários métodos para ensino e aprendizagem, que utilizam tecnologias da informaçao e comunicaçao, visando adaptar e melhorar a experiencia do estudante. Os softwares educacionais, por exemplo, permite a criaçao de inúmeras ferramentas com o objetivo de melhorar os processo de ensino e aprendizagem. Uma alternativa para a criaçao desse tipo de ferramentas é a inteligencia artificial, que é um campo de estudos multidisciplinar, originado da computaçao, da engenharia, da psicologia, da matemática e da cibernética. O seu principal objetivo é construir sistemas que apresentem comportamento inteligente e desempenhem tarefas com um grau de competencia equivalente ou superior ao de um especialista humano (Nikolopoulos, 1997).
Quando aplicada a Educaçao, os métodos de IA podem ser usados para obter e representar conhecimento em processos de ensino e aprendizagem, oferecendo as ferramentas necessárias aos professores para reunir evidencias de maneira sistemática, detalhada e incremental em apoio as suas práticas pedagógicas.
Alguns fundamentos importantes para a adoçao da perspectiva da contribuiçao metodológica da IA para a Educaçao foram estabelecidos Bundy (1986), que a categorizou em tres tipos: (i) IA básica, com o objetivo de explorar técnicas computacionais para simular o comportamento inteligente , (ii) IA aplicada, focada em usar as técnicas existentes de IA para criar produtos para atender necessidades do mundo real e (iii) ciencia cognitiva com foco no estudo da inteligencia humana ou animal por meios computacionais. Essa distinçao permanece crucial na medida em que permite uma definiçao mais precisa da IA na educaçao, trazendo a tona a dependencia entre as tecnologias inteligentes e educacionais projetadas e a finalidade, o contexto e o design do seu uso (Mark, & Greer, 1993).
Após esta conceituaçao sobre IA na Educaçao, foi realizada uma pesquisa na base Elsevier Scopus utilizando a expressao - education AND "artificial intelligence". O objetivo foi a recuperaçao de forma mais abrangente. Entăo, a pesquisa resultou em 51.768 documentos, no período de 1970 a 2020. A Figura 2 apresenta a evoluçao dos quantitativos de documentos publicados no período. Observa-se que o pico de publicaçoes ocorreu em 2017.
Os metadados da pesquisa bibliográfica foram lidos pelo VOSviewer (Waltman, van Eck, & Noyons, 2010) e selecionada a opçao de coocorrencia de palavras-chave do autor. O software recuperou 73.533 palavras-chave. Foi selecionada a opçao de ocorrencia de pelo menos 50 vezes e sem emprego do arquivo de tesauros para o controle do vocabulário. A rede resultou em 359 palavras-chave, 4 clusters e 14.028 arestas.
Para melhorar a visualizaçao da coocorrencia de palavras foi elaborado um arquivo de Tesauros, em que os termos genéricos (metodologia, tecnología, software, etc) foram eliminados e os termos com mesmo significados, mas com ortografias diferentes, foram atribuidos a um único termo. Por exemplo, termos no singular e no plural, foram direcionados para apenas um deles. A rede de coocorrencia de palavras-chave foi gerada outra vez, mas com o arquivo de Tesauros e pelo menos 50 ocorrencias, resultando em 152 termos, 5 clusters e 3.557 arestas. A Figura 3 apresenta uma visualizaçao da coocorrencia de termos das referencias recuperadas na pesquisa bibliográfica.
Nota-se que os seguintes termos se destacam: education, e-leaming, machine learning, teaching/learning strategies, intelligent tutoring systems, artificial intelligence, active learning, collaborative learning, entre outros. Contudo, alguns termos com baixa frequencia devem ser observados por oferecerem oportunidades de pesquisa, tais como: learning design, mainfold learning, problem-based learning, robotics, augmented reality, improving classroom teching, etc.
Para aprofundar a análise dos dados, foi usado o Gephi, um software de código aberto para exploraçao e manipulaçao de redes. A rede gerada pelo VOSviewer foi salva no formato GML para ser importado pelo Gephi, cujos módulos podem importar, visualizar, filtrar, manipular e exportar diversos tipos de redes (Bastian, Heymann, & Jacomy, 2009). Foram calculadas as métricas de grau médio, classe de modularidade e centralidade de autovetor.
A Figura 4 mostra o grafo resultante. Observa-se que alguns tópicos se destacam: education, higher education, e-learning, collaborative learning, artificial intelligence. As arestas com maior espessura revelam o forte relacionamento entre estes tópicos.
Contudo, o Gephi possui uma funcionalidade de Laboratorio de Dados, onde é possível extrair informaçoes sobre as métricas de redes. A Tabela i apresenta as 15 palavraschave com maiores centralidades de autovetor.. Observa-se que o termo com maior centralidade de autovetor é o e-learning.
A identificaçao dos clusters foi realizada a partir da análise dos termos em cada comunidade. A Tabela 2 apresenta os termos de cada cluster.
Em seguida, as listas de termos e de arestas foram exportadas em formato CSV e recuperadas em uma planilha Excel, para serem analisadas no yEd2, que é um software livre para ediçao de grafos. Devido a limitaçao de representaçao do yEd, foram selecionadas as 30 palavras-chave mais relevantes sobre o tema e obtida a visualizaçao dos termos artificial intelligence e education. O espaço conceitual é apresentado na Figura 5. É importante ressaltar que a inteligencia artificial na educaçao nao pode ter foco apenas na tecnología. Deve-se entender como a tecnología poderá sustentar novas estratégias de ensino e aprendizagem.
5. Discussao
A exploraçao de um dominio do conhecimento, utilizando um espaço conceitual (Gärdenfors, 2014), possibilita a visualizaçao de relaçoes entre palavras-chave representadas pelos conceitos ali incluidos (Dahlberg, 1978). Para a definiçao da expressao de busca, é importante que o dominio temático a ser analisado seja conceituado com foco na abrangencia da recuperaçao de referencias bibliográficas.
No exemplo apresentado, foi recuperado uma grande quantidade de referencias, o que tornou inviável a interpretaçao dos resultados sem o auxilio de ferramentas computacionais. Outro ponto a destacar é que os metadados das referencias bibliográficas podem ser organizados em redes ou sistemas de conceitos. O mapeamento de coocorrencia de palavras-chave, por meio de análise de redes e da utilizaçao de vocabulário controlado, constitui um sistema de conceitos que é muito útil na análise de um dominio temático (Moresi et al, 2019).
Para o mapeamento do tema inteligencia artificial e educaçao, foram utilizados os recursos do VOSviewer, para a leitura dos metadados dos documentos, do Gephi, para o cálculo das métricas de redes, e do yEd, para a representaçao do espaço conceitual do dominio temático. Os resultados mostraram que foram identificados 5 subdomínios que constituem o tema analisado: tecnología educacional, educaçao, inteligencia artificial, sistemas inteligentes e assuntos pedagógicos. Esse ponto é importante, porque a tecnologia deve ser vista como meio enquanto a educaçao como fim. Isso significa que as estratégias de ensino e aprendizagem deverao evoluir com o apoio da inteligencia artificial.
6. Concluso es
O objetivo deste artigo foi apresentar e descrever uma metodologia de mapeamento de dominios de conhecimento utilizando ferramentas computacionais, que facilitam a elaboraçao de sistemas de conceitos, expressoes de busca e significaçao da informaçao recuperada. O exemplo apresentado mostra a importância da abrangencia de uma pesquisa bibliográfica para a recuperaçao de referencias.
Assim, as melhorias e o aumento das opçoes de visualizaçao dos dados e informaçoes, assim como a agregaçao de recursos de semântica computacional, trazem novas possibilidades de insights cognitivos para o reconhecimento de padroes em sistemas conceituais complexos. Dessa forma, as soluçoes relatadas no presente artigo aumentam a aplicabilidade e o uso efetivo de dados e informaçoes em processos envolvendo o desenvolvimento e aplicaçoes de inovaçoes em Ciencia & Tecnologia, apontando tendencias, oportunidades e desafios em contextos mais organizados de dominios do conhecimento.
Em nivel mais operacional, as soluçoes metodológicas e tecnológicas aqui apresentadas trazem facilidades nos processos de reuniao, processamento, compartilhamento e disseminaçao do conhecimento, explorando o potencial de linguagens hibridas e complementares de representaçao. Isso permite uma melhor apreensao desses conteúdos informacionais em diversos niveis de reuso.
Como perspectivas futuras de pesquisa, sugere-se que sejam exploradas outras unidades de análise bibliométrica tais como redes de citaçao, de cocitaçao e de acoplamento bibliográfico de documentos. Estes tipos de análises podem revelar fronteiras de pesquisa, bem com a estrutura cognitiva de um domínio temático.
1 "Inteligencia é a informaçao avaliada" (Clauser & Weir, 1976)
2 Disponível em: https://www.yworks.com/products/yed
Referencias
Bassecoulard, E., & Zitt, M. (1999). Indicators in a research institute: A multi-level classification of scientific journals. Scientometrics, 44 (3), 323-345.
Bastian, M., Heymann, S., & Jacomy, M. (2009). Gephi: An Open Source Software for Exploring and Manipulating Networks. In: Proceedings of the Third International ICWSM Conference, 361-362.
Bundy, A. (1986). What kind of field is artificial intelligence? In: DAI Research Paper No.305. Department of Artificial Intelligence, University of Edinburgh.
Mark, M.A., & Greer, J. (1993). Evaluation methodologies for intelligent tutoring systems. Journal of Artificial Intelligence in Education, 4, 129-153.
Cahlik, T. (2000). Comparison of the maps of science. Scientometrics, 49(3), 373-387.
Callon, M., & Law, J. (1983). From translations to problematic networks: An introduction to co-word analysis. Social Science Information, 22, 191-235.
Chen, C., & Song, M. (2017). Representing Scientific Knowledge: The Role of Uncertainty. Springer International Publishing.
Clauser, J., & Weir, S. M. (1976). Intelligence research methodology: An introduction to techniques and procedures for conducting research in defense intelligence. Washington: Defense Intelligence School.
Dahlberg, I. (1978). Teoria do conceito. Ciencia da informagāo, 7(2), 101-107.
Erosheva, E., Fienberg, S., & Lafferty, J. (2004). Mixed-membership models of scientific publications. In Proceedings of National Academy of Sciences of the United States of America, 101, 5220-5227.
Gärdenfors, P. (2014). The Geometry of Meaning: Semantics Based on Conceptual Spaces. Cambridge, MA: MIT Press.
Garfield, E. (1994). Scientography: Mapping the tracks of science. Current Contents: Social & Behavioural Sciences, 7(45), 5-10.
Griffiths, T. L., & Steyvers, M. (2004). Finding scientific topics. In Proceedings of National Academy of Sciences of the United States of America, 101, 5228-5235.
Hjørland, B. (1997). Information seeking and subject representation: an activitytheoretical approach to information science. Westport: Greenwood Press.
Levine, D., Strother-Garcia, K., Hirsh-Pasek, K., & Golinkoff, R. M. (2017). Names for things... and actions and events: following in the footsteps of Roger Brown. In Fernández, E. M., & Cairns, H. S. (Ed.) (2017). The Handbook of Psycholinguistics. Hoboken, NJ: John Wiley & Sons, Inc.
Lévy, P. (2011). The semantic sphere: computation, cognition, and information economy. Hoboken, NJ: John Wiley & Sons, Inc.
Leydesdorff, L. (1997). Why words and co-words cannot map the development of the sciences. Journal of American Society of Information Science, 48, 418-427.
Moresi, E. A .D., Pierozzi Júnior, I., Oliveira, L. H. M., & Brandăo, A. M. (2019). Organizaçao e representaçao de conhecimento: incrementos metodológicos e tecnológicos para o mapeamento conceitual. Atas do 8o Congresso Ibero-Americano em Investigaçao Qualitativa 2019, Lisboa, Portugal, 3, 269-278.
Nikolopoulos, C. (1997). Expert systems: introduction to first and second generation and hybrid knowledge based systems. New York: Marcel Dekker, Inc.
Noyons, E. C. M., Moed, H. F., & Luwel, M. (1999). Combining mapping and citation analysis for evaluative bibliometric purposes: a bibliometric study. Journal of American Society of Information Science, 50, 115-131.
Oliveira, L. H. M. (2009). E-TERMOS: Um ambiente colaborativo web de gestāo terminológica. (Tese de Doutorado em Ciencia da Computaçao), Instituto de Ciencias Matemáticas e de Computaçao, Universidade de Săo Paulo, Săo Paulo.
Salvador, M. R., & Lopez-Martinez, R. E. (2000). Cognitive structure of research: Scientometric mapping in sintered materials. Research Evaluation, 9, 189-200.
Shiffrin, R. M., & Börner, K. (2004). Mapping knowledge domains. In Proceedings of the National Academy of Sciences of the United States of America, 101 (Suppl 1), 5183-5185.
Soergel, D. (2008). Digital Libraries and Knowledge Organization Systems. In Kruk, S. (Ed.) (2008). Semantic Digital Libraries. Berlin: Springer.
Torres, T. Z., Pierozzi Jr, I., Pereira, N. R., & De Castro, A. (2011). Knowledge management and communication in Brazilian agricultural research: An integrated procedural approach. International Journal of Information Management, 31(2), 121-127.
Waltman, l., van Eck, N. J., & Noyons, E. C. M. (2010). A unified approach to mapping and clustering of bibliometric networks. Journal of Informetrics, 4 (4), 629-635.
Wilson, T. D. (2002). The nonsense of knowledge management. Information Research, 8(1), 1-8.
Yworks (nd). yEd Graph Editor: High-quality diagrams made easy. Retrieved from https://www.yworks.com/products/yed.
Zhao, D., & Strotmann, A. (2008). Evolution of research activities and intellectual influences in information science 1996-2005: Introducing author bibliographiccoupling analysis. Journal of the American Society for Information Science and Technology, 59 (13), 2070-2086.
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
© 2019. This work is published under https://creativecommons.org/licenses/by-nc-nd/4.0/ (the “License”). Notwithstanding the ProQuest Terms and Conditions, you may use this content in accordance with the terms of the License.
Abstract
Abstract: This article presents and describes a methodology of knowledge organizing and representing of research themes, whose execution allows the alignment of several tools aiming, systems of knowledge organization as a resource to facilitate the elaboration of concept systems, search expressions and information signification recovered from databases. The proposed methodology consists of four steps based on methods and techniques of: mapping the knowledge domain; knowledge codification; linguistic corpus applications and natural language processing; and knowledge representation. [...]the analysis of the keyword co-occurrence network is performed, revealing the conceptual space that emerges from the retrieved literature. Keywords: knowledge mapping; knowledge organization; knowledge representation; conceptual spaces; artificial intelligence in education. 1.Introduçao Na era do conhecimento, os processos de pesquisa, desenvolvimento e inovaçao, devido ao alto grau de complexidade e multi, inter e transdisciplinaridade temática, tem sido executados, cada vez mais, por meio das chamadas redes de conhecimento (Torres, Pierozzi, Pereira & Castro, 2011).
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
Details
1 Universidade Católica de Brasília, QS 07 Lote 01 EPCT Bloco N, 71966-700, Brasilia, DF, Brasil
2 Afiliação do Autor Dois, Morada, Código postal, Localidade, País
3 Centro de Gestão e Estudos Estratégicos, Morada, Código postal, Localidade, País