Proposition de Stage de Recherche 2006

Master Recherche en Informatique, deuxième année

Université Montpellier II

 

Laboratoire

      Nom du laboratoire LGI2P-EMA

      domaine d'activité : Génie Informatique et Ingénierie de Production

      adresse : Parc Scientifique Georges Besse
F - 30035 Nîmes Cedex 1

      telephone

      fax

      e-mail

      URL : http://www.ema.fr

 

 

Tuteur laboratoire

      Nom : : Michel Crampes (HDR)

      laboratoire/équipe: LGI2P-EMA/ équipe KDD

      thématique : cartographie des connaissances, ontologies, indexation multimédia, composition multimédia automatique, modèles bayésiens

      e-mail : michel.crampes @ ema.fr

      URL : http://www.ema.fr/~mcrampes/


Sujet de Stage

mots-clés :

connaissances, ontologie, cartographie, info-vis, multimédia, indexation, modèles bayésiens


modules du Master requis (consulter la page web)
(préférentiellement, mais pas obligatoire)

Intégration de Données XML, Représentation des connaissances, Interaction médiatisée: des IHM adaptées aux IHM actives, Visualisation d'informations, Apprentissage

Contexte (développer en quelques lignes)

Le projet de recherche s’inscrit dans le cadre d’un projet RIAM/ANR (http://www.riam.org/riam/display.jsp?id=p_1726) : le projet SAVIC. Il est lancé par l’équipe Documents et Interfaces Adaptatifs, au sein du projet KDD (Knowledge Discovery) du laboratoire LGI2P de l’Ecole des Mines d’Ales. Le projet est conduit avec la société Netia (société régionale, l’un des leaders mondiaux de logiciels pour radios et TV). Il s’agit, à partir d’un prototype déjà opérationnel, de généraliser une approche d’indexation visuelle de documents multimédia sous forme de cartes de connaissances interactives. Le projet est connexe à d’autres projets de cartographie de connaissance au sein de l’équipe . Le stage peut se faire à Ales (logement en cité universitaire possible) en équipe avec un étudiant australien (pratique quotidienne de l’anglais), ou à Nimes au sein du LGI2P. Dans chaque cas, la liaison entre les deux sites est fréquente.

Position du problème (idem)
Le projet est au croisement de plusieurs domaines (voir mots clefs). L’indexation de documents prend en général trois formes : tout automatique par analyse de texte (documents textuels), ou du signal (documents visuels, ou audio) ; manuel libre ; manuel à partir de structures lexicales ou sémantiques (ontologies). Le premier cas donne un résultat à faible charge sémantique ; les deux autres demandes beaucoup de temps, de la compétence, et fournissent des résultats incomplets. Nous avons développé une méthode d’indexation semi-automatique à partir d’une carte conceptuelle dans le domaine de la musique. Les premiers résultats sont très prometteurs. Dans le projet proposé, il s’agit de les conforter, en voir les limites, améliorer les algorithmes, et généraliser au visuel (photos, vidéos) et au multimédia.
Un autre aspect de la recherche porte sur la composition automatique personnalisée de documents multimédia à partir de leur indexation. La carte de connaissance sert de support à l’élaboration de modèles bayésiens de composition. Ici aussi les résultats intermédiaires sont très positifs. Il s’agit de conforter et généraliser.

Travail demandé

Il correspond aux tâches du projet SAVIC : analyse des modèles existants, proposition d’enrichissement des modèles, modélisation, implémentation et tests sur jeux d’essai.
Le stagiaire sera amené à préparer et à présenter un article portant sur les travaux de l’équipe et en particulier sur ses propres résultats.

 

Possibilité de poursuivre en thèse (contrat CIFRE par exemple

Possibilité de bourse de thèse à l’EMA.

 

Bibliographie

Article présentant le projet actuel : An Integrated Visual Approach for Music Indexing and Dynamic Playlist Composition, M. Crampes, S. Ranwez, F. Velickovski, C. Mooney, N. Mille. MMCN 2006, San José, Californie.

 

Autres :

[1]     Adams, W.H., Iyengar, G., Lin, C-Y, Naphade, M.R., Neti, C., Nock, H.J., Smith, .R. Semantic Indexing of Multimedia Content Using Visual, Audio and Text Cues. In Eurasip Journal on Applied Signal Processing, Vol 2003-2, Feb. 2003.

[2]     Aucouturier, J.-J. and F. Pachet Scaling up Music Playlist Generation. IEEE International Conference on Multimedia Expo, Lausanne (Switzerland), August 2002.

[3]     Basalaj, W. Proximity Visualisualisation of Abstract Data. Technical Report UCAM-CL-TR-509, University of Cambridge, 2001.

[4]     Battista, G., Eades, P., Tamassia, R., Tollis, I., Graph drawing. Algorithms for the visualisation of graphs. Prentice Hall, 1999.

[5]     Berge, C. Hypergraphs: The Theory of Finite Sets. Amsterdam, Netherlands: North-Holland, 1989.

[6]     Brown P., Della Pietra V., deSouza P., Lai J., Mercer R. (1992). "Class-Based n-Gram Models of Natural Language", Computational Linguistics, Vol.18, pp.467-479.

[7]     Buja, A.,and Swayne, D.F Visualization Methodology for Multidimensional Scaling. In Journal of Classification 19(1):7-43, 2002.

[8]     Chalmers, M., A Linear Iteration Time Layout Algorithm for Visualising High–Dimensional Data. Proc IEEE Visualization ‘96, San Francisco, pp. 127-132, 1996.

[9]     Deng, D., Zhang, J. and Purvis, M. (2004). Visualisation and Comparison of Image Collections based on Self-organised Maps. In Proc. Australasian Workshop on Data Mining and Web Intelligence (DMWI2004), Dunedin, New Zealand. CRPIT, ACSW Frontiers, vol. 32, J. Hogan, P. Montague, M. Purvis and C. Steketee Eds. pp.97-102, 2004.

[10]  Dixon S.: Analysis of Musical Content in Digital Audio. In Computer Graphics and Multimedia: Applications, Problems, and Solutions, J. DiMarco ed., pp 214-235, 2004.

[11]  Eades, P. A heuristic for graph drawing. In proc. of the 13th Manitoba Conference on Numerical Mathematics and Computing. Vol. 24. Utilitas Mathematica, University of Manitoba, Winnipeg, Canada, Sept-Oct, 1984.

[12]  Eades, P., Lin, X., Spring algorithms and symmetry. In Theoretical Computer Science 240(2):379-405, 2000.

[13]  Escoffier B., Pagès J. - Analyses fatorielles simples et multiples. Dunod, Paris, 1990.

[14]  Faloutsos, K. Lin, FastMap: A Fast Algorithm for Indexing, Data-Mining and Visualization of Tr additional and Multimedia Datasets, in Proceedings of 1995 ACM SIGMOD, SIGMOD RECORD (June 1995), vol.24, no.2, p 163-174.

[15]  Field A., Hartel, P., Mooij, W. Personal DJ, an architecture for personalised content delivery Full text. Proc; 10th international conference on World Wide Web Hong Kong, pp. 1-7, 2001.

[16]  Hayes B. A progress report on the fine art of turning literature into drivel. Computer Recreation, Scient. American, 1984.

[17]  Kohonen, T. Self-Organizing Maps. Springer Series in Information Sciences, Vol. 30, Springer, Berlin, Heidelberg, New York, 2001.

[18]  Lesaffre, M., Leman, M., De Baets, B., Martens, J.P. Methodological Considerations Concerning Manual Annotation Of Musical Audio. In Function of Algorithm Development. 5th International Conference on Music Information Retrieval, Barcelona, ISMIR, 2004.

[19]  McKay, Cory, Ichiro Fujinaga. Automatic Genre Classification Using Large High-Level Musical Feature Sets, 5th Int. Conference on Music Information Retrieval Barcelona ISMIR, 2004.

[20]  Morrison, A., Ross, G., Chalmers, M. Fast Multidimensional Scaling through Sampling, Springs and Interpolation. In Information Visualization 2(1):68-77, March 2003.

[21]  Pachet, F. and Zils, A. Evolving Automatically High-Level Music Descriptors From Acoustic Signals. Springer Verlag LNCS 2771, 2003.

[22]  Pachet, F. Content Management for Electronic Music Distribution:What Are the Issues? Communications of the acm, April 2003.

[23]  Pachet, F., Cazaly, D. A Taxonomy of Musical Genres Content-Based Multimedia Information Access Conference (RIAO), Paris, April 2000.

[24]  Pampalk, E, Rauber, A., Merkl, D., Content-based Organization and Visualization of Music Archives. Proceedings of the ACM International Conference on Multimedia, Juan les Pins, Dec. 2002.

[25]  Pauws, S., Eggen, B., PATS: Realization and user evaluation of an automatic playlist generator. Proceedings, ISMIR 2002.

[26]  Platt J. Fast Embedding of Sparse Music Similarity Graphs. Microsoft Research.