Categorizzazione Automatica di Brevetti: Lo stato dell'arte Riccardo Cardin Data: 13 Febbraio, ore 14:30 Luogo: Sala Riunioni IV piano, Torre Archimede Abstract: La corretta categorizzazione dei brevetti e conseguentemente il loro successivo recupero è un'attività di fondamentale importanza nel campo produttivo-industriale. Questa importanza è stata sottolineata recentemente anche dall'interesse crescente di Google al tema. A livello mondiale la gestione dei brevetti è affidata ad un'organizzazione internazionale affiliata alle Nazioni Unite, la World Intellectual Property Organisation (WIPO). Questa agenzia ha redatto una propria tassonomia del sapere umano, l'International Patent Classification (IPC) scheme e un proprio modus operandi nella categorizzazione di un brevetto. Ogni brevetto infatti, vede associato un codice IPC principale e una serie di codici IPC sencodari. E' chiaro come il problema di classificazione che ne segue sia un problema molto particolare, ma riscontrabile in numerosi altri schemi di classificazione adottati in altre collezioni di testi (per esempio OSHUMED sulla tassonimia MeSH). WIPO nel 2002 ha reso disponibile pubblicamente una collezione di brevetti con la relativa categorizzazione (WIPO-alpha), in modo tale da poter favorire la ricerca di soluzioni automatizzate al problema della categorizzazione di brevetti. Ad oggi la comunità del Machine Learning ha fornito diverse soluzioni alla categorizzazione dei brevetti su IPC, focalizzandosi di volta in volta su aspetti differenti del problema di classificazione originale. Nel seminario si illustreranno le soluzioni più recenti, focalizzandosi sul tipo di problema in esse risolto e su come la collezione WIPO-alpha venga in esse utilizzata.