Recuperación de textos de propiedades medicinales mediante indexación semántica latente e índices invertidos

Augusto Parcemom Cortez Vasquez

Resumen


Desde tiempos remotos, el tratamiento de enfermedades con plantas medicinales ha sido una práctica muy común en las comunidades rurales. La terminología utilizada difiere textualmente, sin embargo se pueden relacionar en función de sus conceptos. Para ello se utiliza técnicas como la indexación semántica latente que busca categorizar conceptos más que textos, asimismo se utiliza la técnica de índices invertidos con el fin de asociar los textos que contengan términos a consultar por los usuarios. El enfoque de clasificación considera  que dado un conjunto de documentos D y un conjunto de categorías C, encontrar una función haga corresponder a un documento d tomado de D,  una categoría determinada c en C. Para ello realiza un análisis léxico que identifique  las subsecuencias de  lexemas de d, luego mediante un análisis string kernel encuentre el grado de similitud entre dos textos. Se utilizan asimismo la técnica de punteros invertidos a fin de encontrar documentos que contienen los términos a consultar. Dos textos son más similares mientras tengas más subsecuencias en común. Se presenta una aplicación de clasificación que haga corresponder a un documento (texto de propiedades medicinales de una planta) una categoría C que serán las propiedades mismas de las plantas.

 


Palabras clave


Categorización de textos, índices invertidos, string kernel. indexación semántica latente , propiedades medicinales de plantas

Texto completo:

PDF

Referencias


Putri A. ,(2017) “Word Level Auto-correction for Latent Semantic Analysis Based Essay Grading System”. Department of Electrical Engineering, Faculty of Engineering Universitas Indonesia Depok, Indonesia. 15th Intl. Conf. QiR: Intl. Symp. Elec. and Com. Eng

-602-50431-1-6/17/$31.00 ©2017 IEEE

Chowdhury,R.(2017) “An Approach to Generic Bengali Text Summarization Using Latent Semantic Analysis”. Department of Electrical Engineering, Faculty of Engineering Universitas Indonesia Depok, Indonesia. 2017 International Conference on Information Technology

-1-5386-2924-6/17 $31.00 © 2017 IEEE DOI 10.1109/ICIT.2017.12

Cortez, A. (2013). “Categorización de textos utilizando análisis string kernel e indexación semántica latente: aplicación de textos de propiedades medicinales de plantas” ” Revista PAIDEIA XXI Vol 4 Nª5 Pág. 113-123 Universidad Ricardo Palma

Gallegos M. (2016) “Las plantas medicinales: principal alternativa para el cuidado de la salud, en la población rural de Babahoyo, Ecuador” An. Fac. med. vol.77 no.4 Lima oct./dic. 2016

Cortez, A. (2014). “Categorización de textos mediante maquinas de soporte vectorial” Revista RISI (Revista de Investigaciones de Sistema e Informática Vol 10 Nª1 Lima Perú Pag.33

OMS (2016). Medicina tradicional: definiciones [Internet]. WHO. [citado 24 de julio de 2016]. Disponible en:

http://www.who.int/topics/traditional_medicine/definitions/es/.


Enlaces refback

  • No hay ningún enlace refback.


Copyright (c) 2019 In Crescendo

Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento 4.0 Internacional.

Universidad Católica Los Ángeles de Chimbote. Chimbote, Perú 

ISSN2222-3061 (print) - 2307-5260 (online)  

Websitehttp://dx.doi.org/10.21895/incres 
Dirección: Jr. Tumbes 247, Chimbote, Ancash, Perú.
Correo electrónico: increscendo@uladech.edu.pe
Telefax: (+51) 43-327933