Javascript must be enabled to continue!
CLASSIFICAÇÃO DE DOCUMENTOS DE PATENTES USANDO O DOC2VEC
View through CrossRef
As patentes são consideradas fontes extremamente úteis para atividades relacionadas à busca e análise de informações e para a geração de novos conhecimentos. Neste artigo, usamos um algoritmo de vetor de parágrafo doc2vec, uma extensão do word2vec, que aprende representações de frases em um documento, em um esquema de aprendizagem profunda supervisionada para a classificação automática de patentes. A classificação foi realizada em documentos com resumos de patentes em inglês, em um processo hierárquico que compreende seções, classes, subclasses, de acordo com a Classificação Internacional de Patentes (IPC). Os testes foram desenvolvidos em quatro etapas, necessária, devido ao grande número de classes e subclasses, com o objetivo de identificar códigos IPC primário ou secundários, caso esteja associado a um conjunto de classificações relacionadas a outros aspectos expressos na patente. Os testes apresentaram resultados bastante promissores na classificação de patentes. Os próximos passos serão produzir avaliações qualitativas e compará-las com outros modelos de aprendizagem de máquina presentes na literatura.
Title: CLASSIFICAÇÃO DE DOCUMENTOS DE PATENTES USANDO O DOC2VEC
Description:
As patentes são consideradas fontes extremamente úteis para atividades relacionadas à busca e análise de informações e para a geração de novos conhecimentos.
Neste artigo, usamos um algoritmo de vetor de parágrafo doc2vec, uma extensão do word2vec, que aprende representações de frases em um documento, em um esquema de aprendizagem profunda supervisionada para a classificação automática de patentes.
A classificação foi realizada em documentos com resumos de patentes em inglês, em um processo hierárquico que compreende seções, classes, subclasses, de acordo com a Classificação Internacional de Patentes (IPC).
Os testes foram desenvolvidos em quatro etapas, necessária, devido ao grande número de classes e subclasses, com o objetivo de identificar códigos IPC primário ou secundários, caso esteja associado a um conjunto de classificações relacionadas a outros aspectos expressos na patente.
Os testes apresentaram resultados bastante promissores na classificação de patentes.
Os próximos passos serão produzir avaliações qualitativas e compará-las com outros modelos de aprendizagem de máquina presentes na literatura.
Related Results
Patentes em células-tronco: suas principais características e análise de citação
Patentes em células-tronco: suas principais características e análise de citação
Estudo patentométrico e análise de citação dos documentos de patentes em células-tronco indexados na base de dados Derwent Innovation Index. A partir da Lei do Elitismo, fizeram pa...
MONITORAMENTO TECNOLÓGICO DE PATENTES ENVOLVENDO PREBIÓTICOS NO CENÁRIO GLOBAL E BRASILEIRO
MONITORAMENTO TECNOLÓGICO DE PATENTES ENVOLVENDO PREBIÓTICOS NO CENÁRIO GLOBAL E BRASILEIRO
Diante da crescente preocupação com uma vida mais saudável, tem-se observado uma maior procura por alimentos que apresentem efeitos positivos na saúde. Dentre os alimentos funciona...
ANÁLISE DE PEDIDOS DE PATENTES DE INVENÇÕES IMPLEMENTADAS POR INTELIGÊNCIA ARTIFICIAL NO BRASIL
ANÁLISE DE PEDIDOS DE PATENTES DE INVENÇÕES IMPLEMENTADAS POR INTELIGÊNCIA ARTIFICIAL NO BRASIL
Os Sistemas de Informação com Inteligência Artificial vêm promovendo uma série de inovações disruptivas em todo o mundo e são considerados uma área prioritária pelo governo brasile...
Mapeamento patentário: estudo de caso das receitas cervejeiras que contém em sua composição adjunto de origem vegetal.
Mapeamento patentário: estudo de caso das receitas cervejeiras que contém em sua composição adjunto de origem vegetal.
O presente trabalho visa realizar uma análise das patentes registradas no Brasil relacionadas com receitas cervejeiras. A partir da verificação bibliográfica foi possível constatar...
FREQUÊNCIA DE ARCADAS PARCIALMENTE DENTADAS SEGUNDO CLASSIFICAÇÃO DE KENNEDY NA POPULAÇÃO NEGRA DO RECÔNCAVO BAIANO
FREQUÊNCIA DE ARCADAS PARCIALMENTE DENTADAS SEGUNDO CLASSIFICAÇÃO DE KENNEDY NA POPULAÇÃO NEGRA DO RECÔNCAVO BAIANO
Introdução: O edentulismo parcial é um estado de saúde oral que corresponde a ausência de elementos dentários. A classificação da arcada parcialmente dentada padroniza a comunicaçã...
Bases de Dados de Patentes: uma análise a partir do portal de periódicos da CAPES
Bases de Dados de Patentes: uma análise a partir do portal de periódicos da CAPES
Esta pesquisa analisa as bases de dados de patentes disponibilizadas no Portal de Periódicos da Capes com o objetivo de apresentar informações sobre as características de cada base...
Bases de Dados de Patentes: uma análise a partir do portal de periódicos da CAPES
Bases de Dados de Patentes: uma análise a partir do portal de periódicos da CAPES
Esta pesquisa analisa as bases de dados de patentes disponibilizadas no Portal de Periódicos da Capes com o objetivo de apresentar informações sobre as características de cada base...
Perspectivas sobre a gestão de documentos
Perspectivas sobre a gestão de documentos
A gestão de documentos é um tema muito discutido na área de Arquivologia, visto que envolve em seu bojo ações importantes para que os documentos sejam gerenciados desde a produção ...

