15 de diciembre 2017
Sede de la Universidad de Cartagena - Centro Histórico (dirección)
Conferencias en homenaje a Didier Dacunha-Castelle: Matemática Estadística y Compromisos
Conferencista : Ricardo Fraiman -Universidad de la República. Montevideo
Clasificación semi-supervisada
Aprendizaje semi-supervisado se ocupa del problema de cómo, si es posible, tomar
ventaja de una gran cantidad de datos
clasificados, para realizar la clasificación, en
cuando, típicamente, los datos etiquetados son pocos. Aunque esto no siempre
es posible (dependiendo de la útilidad de conocer la distribución de los datos no etiquetados
en la inferencia de las etiquetas), varios algoritmos han sido propuestos. Proponemos un nuevo
algoritmo, que bajo condiciones casi necesarias, logra asintóticamente
el rendimiento de la mejor regla teórica, cuando el tamaño de los datos sin etiqueta
tiende al infinito. El conjunto de suposiciones necesarias, aunque razonables, muestran que
la clasificación semi-supervisada solo funciona para problemas muy bien condicionados.
Semi-supervised clasification
Semi-supervised learning deals with the problem of how, if possible, to take advantage of a huge amount of not classified data, to perform classification, in situations when, typically, the labelled data are few. Even though this is not always possible (it depends on how useful is to know the distribution of the unlabelled data in the inference of the labels), several algorithm have been proposed recently. A new algorithm is proposed, that under almost neccesary conditions, attains asymptotically the performance of the best theoretical rule, when the size of unlabeled data tends to infinity. The set of necessary assumptions, although reasonable, show that semi–supervised classification only works for very well conditioned problems.