Programa : Matemáticas del azar. Gestionar la complejidad modelando las incertidumbres

Fraiman

15 de diciembre 2017
Sede de la Universidad de Cartagena - Centro Histórico     (dirección)

Conferencias en homenaje a Didier Dacunha-Castelle: Matemática Estadística y Compromisos

Conferencista : Ricardo Fraiman -Universidad de la República. Montevideo

Clasificación semi-supervisada

Aprendizaje semi-supervisado se ocupa del problema de cómo, si es posible, tomar ventaja de una gran cantidad de datos
clasificados, para realizar la clasificación, en cuando, típicamente, los datos etiquetados son pocos. Aunque esto no siempre
es posible (dependiendo de la útilidad de conocer la distribución de los datos no etiquetados en la inferencia de las etiquetas), varios algoritmos han sido propuestos. Proponemos un nuevo algoritmo, que bajo condiciones casi necesarias, logra asintóticamente el rendimiento de la mejor regla teórica, cuando el tamaño de los datos sin etiqueta tiende al infinito. El conjunto de suposiciones necesarias, aunque razonables, muestran que la clasificación semi-supervisada solo funciona para problemas muy bien condicionados.

Semi-supervised clasification

Semi-supervised learning deals with the problem of how, if possible, to take advantage of a huge amount of not classified data, to perform classification, in situations when, typically, the labelled data are few. Even though this is not always possible (it depends on how useful is to know the distribution of the unlabelled data in the inference of the labels), several algorithm have been proposed recently. A new algorithm is proposed, that under almost neccesary conditions, attains asymptotically the performance of the best theoretical rule, when the size of unlabeled data tends to infinity. The set of necessary assumptions, although reasonable, show that semi–supervised classification only works for very well conditioned problems.