ahmed boughedda | Hassiba Ben Bouali University (original) (raw)

Related Authors

Laila Najah

University Mohamed V, Faculté Des Sciences Rabat Agdal

Miguel Correia

Olivier Teste

Uploads

Thesis Chapters by ahmed boughedda

Research paper thumbnail of DML based Map-reduce

Dans le monde d’aujourd’hui de multiples acteurs de la technologie numérique produisent des quant... more Dans le monde d’aujourd’hui de multiples acteurs de la technologie numérique produisent des quantités infinies de données. Capteurs, réseaux sociaux ou e-commerce, ils génèrent tous de l’information qui s’incrémente en temps-réel selon les 3V de Gartner : en Volume, en Vitesse et en Variabilité.
L’optimisation du temps de traitement des opérations sur les bases de données ont toujours été un sujet très étudié aussi bien par les développeurs que par les chercheurs. L’apparition des systèmes distribué a pu guidé les études ainsi que les recherches vers des techniques de résolutions de plus en plus optimales, en divisant en ensemble de tâches destinées à être réparties sur différents noeuds ou cluster.
Avec l’émergence des applications intensives en manipulation de données, les approches d’évaluation des opérations réparties basées sur le modèle de program-mation MapReduce ont gagné en popularité. Néanmoins, ces approches n’évitent pas le problème de déséquilibrage des valeurs de l’attribut dans la première phase du modèle MapReduce.
Pour répondre à cette question et après une étude des techniques proposées qui traitent les opérations de base de données (jointure, sélection et projection) avec MapReduce, le présent travail propose une approche pour équilibrer les charges de traitements sur des différentes machines. Cette approche exploite le mécanisme de la deuxième version du traitement distribué MapReduce 2.

Research paper thumbnail of DML based Map-reduce

Dans le monde d’aujourd’hui de multiples acteurs de la technologie numérique produisent des quant... more Dans le monde d’aujourd’hui de multiples acteurs de la technologie numérique produisent des quantités infinies de données. Capteurs, réseaux sociaux ou e-commerce, ils génèrent tous de l’information qui s’incrémente en temps-réel selon les 3V de Gartner : en Volume, en Vitesse et en Variabilité.
L’optimisation du temps de traitement des opérations sur les bases de données ont toujours été un sujet très étudié aussi bien par les développeurs que par les chercheurs. L’apparition des systèmes distribué a pu guidé les études ainsi que les recherches vers des techniques de résolutions de plus en plus optimales, en divisant en ensemble de tâches destinées à être réparties sur différents noeuds ou cluster.
Avec l’émergence des applications intensives en manipulation de données, les approches d’évaluation des opérations réparties basées sur le modèle de program-mation MapReduce ont gagné en popularité. Néanmoins, ces approches n’évitent pas le problème de déséquilibrage des valeurs de l’attribut dans la première phase du modèle MapReduce.
Pour répondre à cette question et après une étude des techniques proposées qui traitent les opérations de base de données (jointure, sélection et projection) avec MapReduce, le présent travail propose une approche pour équilibrer les charges de traitements sur des différentes machines. Cette approche exploite le mécanisme de la deuxième version du traitement distribué MapReduce 2.

Log In