Cláudio Schepke | Universidade Federal do Pampa (original) (raw)

Papers by Cláudio Schepke

Research paper thumbnail of Avaliação de Desempenho do Método de Lattice Boltzmann em Arquiteturas multi-core e many-core

Uma alternativa para acelerar o desempenho de uma variedade de algoritmos consiste na execução pa... more Uma alternativa para acelerar o desempenho de uma variedade de algoritmos consiste na execução paralela do código. O Intel Xeon Phi é uma nova maneira de atender a esses requisitos e pode ser programado com técnicas convencionais como Intel Cilk Plus, OpenMP, POSIX Threads e MPI. Outra abordagem frequentemente utilizada em HPC é a Computação em GPUs com OpenCL e CUDA. Neste artigo nós avaliamos o desempenho de dois aceleradores: Tesla C2075, baseada na arquitetura Fermi desenvolvida pela NVIDIA e o coprocessador Intel Xeon Phi, primeira versão da arquitetura Many Integrated Core. Consideramos como estado da arte o Método de Lattice Boltzmann, usado para a simulação da dinâmica de fluidos. A estrutura regular do algoritmo de Lattice Boltzmann torna fácil de identificar o alto grau de paralelismo. Medimos o desempenho e apresentamos uma comparação com resultados obtidos por implementações anteriores desenvolvidas para multi-core e many-core. Os resultados mostram que programação para GPU e Xeon Phi requerem um esforço semelhante, mas geralmente os resultados são melhores em uma GPU.

Research paper thumbnail of Análise de Desempenho de Aplicações Paralelas em Arquiteturas multi-core e many-core

Simulações numéricas auxiliam no avanço da Ciência e exigem cada vez mais recursos computacionais... more Simulações numéricas auxiliam no avanço da Ciência e exigem cada vez mais recursos computacionais. Quanto maior a resolução de um modelo, mais preciso e custoso serão suas previsões. Nesse contexto, analisamos o desempenho de aplicações desenvolvidas para processadores e aceleradores. Nossos experimentos mostram que em aplicações com pouca comunicação, a GPU Tesla C2075 tem desempenho até 8 vezes maior que duas CPUs de 8 cores cada.

Research paper thumbnail of Nuvem Privada com OpenNebula: da Implantação ao Desenvolvimento

Este é um minicurso ministrado na escola regional de redes de computadores em 2016, sobre implant... more Este é um minicurso ministrado na escola regional de redes de computadores em 2016, sobre implantação de nuvem privada com OpenNebula e um estudo de caso para desenvolvimento de plugins. No caso, foi configurado um monitor de consumo energético de máquinas virtuais.

Research paper thumbnail of 2Instituto de Informática – Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15.064 – 91.501-970 – Porto Alegre – RS – Brasil

Resumo. Webservices são serviços de rede voltados à aplicação. Uma das tecnologias existentes em ... more Resumo. Webservices são serviços de rede voltados à aplicação. Uma das tecnologias existentes em webservices é o protocolo SOAP, responsável pela troca de informações entre dois computadores, o qual pode ser facilmente implementado em diversas linguagens de programação, além de poder usar diferentes protocolos de transmissão. Neste sentido, este trabalho tem por objetivo comparar o desempenho de SOAP através do encapsulamento do seu conteúdo utilizando HTTP, SMTP e BEEP. Os resultados obtidos demonstram que tanto HTTP, quanto BEEP apresentam custos mais baixos de transmissão, cada qual se sobressaindo ao outro, dependendo das características referentes ao tipo de comunicação estabelecida. 1. Introdução Webservices oferecem um novo paradigma para a construção de aplicações web distribuídas [Cerami 2002]. Qualquer serviço disponibilizado sob a Internet que utiliza um sistema de comunicação baseado em XML pode ser considerado um webservice [Elizabeth Castro 2001], independente do siste...

Research paper thumbnail of Paralelismo multi-nível: uma revisão sistemática da literatura

Anais da XXI Escola Regional de Alto Desempenho da Região Sul (ERAD RS 2021)

O paralelismo multi-nível explora diferentes níveis de abstração de hardware a fim de melhorar o d... more O paralelismo multi-nível explora diferentes níveis de abstração de hardware a fim de melhorar o desempenho de aplicações. Ferramentas de programação são destinadas normalmente a apenas um nível de paralelismo, destacando-se a ausência de ferramentas que exploram outros níveis de abstração. Este trabalho apresenta uma revisão sistemática da literatura que investiga ferramentas e frameworks que exploram o paralelismo multinível.

Research paper thumbnail of Ambiente de Nuvem Computacional Privada para Teste e Desenvolvimento de Programas Paralelos

A computação de alto desempenho costuma utilizar agregados de computadores para a execução de apl... more A computação de alto desempenho costuma utilizar agregados de computadores para a execução de aplicações paralelas. Alternativamente, a computação em nuvem oferece recursos computacionais distribuídos para processamento com um nível de abstração além do tradicional, dinâmico e sob-demanda. Este capítulo tem como objetivo introduzir conceitos básicos, apresentar noções básicas para implantar uma nuvem privada e demonstrar os benefícios para o desenvolvimento e teste de programas paralelos em nuvem.

Research paper thumbnail of Aprimorando a Análise de Desempenho de Aplicações Baseadas em Tarefas Irregulares e Árvores de Eliminação

Anais da XXI Escola Regional de Alto Desempenho da Região Sul (ERAD RS 2021)

Este trabalho apresenta os resultados de estratégias de aprimoramento da análise de desempenho de... more Este trabalho apresenta os resultados de estratégias de aprimoramento da análise de desempenho de aplicações baseadas em tarefas com carga de trabalho irregular, através da automação de detecção de tarefas anômalas usando modelos de regressão. Também apresentamos técnicas de visualização de desempenho de aplicações baseadas na estrutura da árvore de eliminação, utilizada na paralelização de algoritmos a de fatoração de matrizes esparsas.

Research paper thumbnail of A New Library of Bio-Inspired Algorithms

Computational Science and Its Applications – ICCSA 2020, 2020

Real engineering, science, and economics problems cannot be ever solved exactly due to the high c... more Real engineering, science, and economics problems cannot be ever solved exactly due to the high computation time to find the optimal solution. One way to solve such problems is to apply bio-inspired algorithms, to minimize the time to search for potential solutions. Bio-inspired algorithms are based on the collective behavior of social organisms and are used to solve optimization problems. This article presents a new library of bio-inspired algorithms. The library offers the implementation of some algorithms, being easily extensible through interfaces. An evaluation was made using 7 test functions applied to each of the implemented algorithms. The tests have shown that the ABC algorithm obtained the best convergence results in 5 tests and the ACO algorithm in 2 tests.

Research paper thumbnail of Operações vetoriais aplicadas em uma Biblioteca de Algoritmos Bio-inspirados

A resolução de um problema pode não ser alcançada de forma exata, devido a complexidade dada por ... more A resolução de um problema pode não ser alcançada de forma exata, devido a complexidade dada por um número elevado de variáveis e/ou soluções potenciais. Uma estratégia para modelar esses problemas é utilizar conceitos de computação natural, também conhecida como computação bio-inspirada. Para acelerar a execução de uma aplicação desse tipo, neste trabalho é aplicada a concorrência das instruções entre as unidades vetoriais na biblioteca bio-inspirada desenvolvida pelos autores, diminuindo o tempo de execução e auxiliando os outros desenvolvedores. Com os resultados dos testes, comprovou-se que a versão com instruções concorrentes dos algoritmos desenvolvidos mantém a qualidade da solução e reduz o tempo de execução.

Research paper thumbnail of Um Monitor de Consumo Energético para Computação em Nuvem na Ferramenta OpenNebula

Anais do XVII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2016)

Nuvens computacionais consomem grandes quantidades de energia elétrica, sendo responsáveis pela e... more Nuvens computacionais consomem grandes quantidades de energia elétrica, sendo responsáveis pela emissão de pelo menos 2% do dióxido de carbono mundial. Por outro lado, as ferramentas de gerenciamento de nuvens atuais não dispõem de recursos para monitorar o consumo energético de suas infraestruturas, bem como não oferecem informações sobre a demanda de energia elétrica, sendo este uma parte integrante do custo de manutenção da nuvem. Portanto, este artigo propõe um modelo de monitoramento energético para nuvens computacionais. Foi criado um addon denominado Monitor Energético (ME) para monitorar o consumo energético em data centers virtualizados, através de Kernel-based Virtual Machine e geridos por OpenNebula. Os experimentos foram realizados com a ferramenta Sysbench para o estresse proposital do ambiente de testes, aonde os resultados comprovaram o bom funcionamento da nossa ferramenta e que ela possui uma visualização intuitiva do monitoramento.

Research paper thumbnail of Uso de Operações SIMD em uma Biblioteca de Algoritmos Bio-inspirados

Anais da Escola Regional de Alto Desempenho da Região Sul (ERAD RS 2020)

Uma estratégia para modelar algoritmicamente um problema é utilizar conceitos de computação natur... more Uma estratégia para modelar algoritmicamente um problema é utilizar conceitos de computação natural, também conhecida como computação bio-inspirada. Neste trabalho é proposta uma biblioteca open source bio-inspirada que utiliza instruções SIMD. Com os resultados dos testes, comprovou-se que a versão paralela dos algoritmos desenvolvidos mantém a qualidade da solução e reduz o tempo de execução.

Research paper thumbnail of An Intra-Cloud Networking Performance Evaluation on CloudStack Environment

2017 25th Euromicro International Conference on Parallel, Distributed and Network-based Processing (PDP), 2017

Infrastructure-as-a-Service (IaaS) is a cloud on-demand commodity built on top of virtualization ... more Infrastructure-as-a-Service (IaaS) is a cloud on-demand commodity built on top of virtualization technologies and managed by IaaS tools. In this scenario, performance is a relevant matter because a set of aspects may impact and increase the system overhead. Specific on the network, the use of virtualized capabilities may cause performance degradation (eg.,latency, throughput). The goal of this paper is to contribute to networking performance evaluation, providing new insights for private IaaS clouds. To achieve our goal, we deploy CloudStack environments and conduct experiments with different configurations and techniques. The research findings demonstrate that KVM-based cloud instances have small network performance degradation regarding throughput (about 0.2% for coarse-grained and 6.8% for fine-grained messages) while container-based instances have even better results. On the other hand, the KVM instances present worst latency (about 12.4% on coarse-grained and two times more on fine-grained messages w. r. t. native environment) and better in container-based instances, where the performance results are close to the native environment. Furthermore, we demonstrate a performance optimization of applications running on KVM.

Research paper thumbnail of Private IaaS Clouds: A Comparative Analysis of OpenNebula, CloudStack and OpenStack

2016 24th Euromicro International Conference on Parallel, Distributed, and Network-Based Processing (PDP), 2016

Despite the evolution of cloud computing in recent years, the performance and comprehensive under... more Despite the evolution of cloud computing in recent years, the performance and comprehensive understanding of the available private cloud tools are still under research. This paper contributes to an analysis of the Infrastructure as a Service (IaaS) domain by mapping new insights and discussing the challenges for improving cloud services. The goal is to make a comparative analysis of OpenNebula, OpenStack and CloudStack tools, evaluating their differences on support for flexibility and resiliency. Also, we aim at evaluating these three cloud tools when they are deployed using a mutual hypervisor (KVM) for discovering new empirical insights. Our research results demonstrated that OpenStack is the most resilient and CloudStack is the most flexible for deploying an IaaS private cloud. Moreover, the performance experiments indicated some contrasts among the private IaaS cloud instances when running intensive workloads and scientific applications.

Research paper thumbnail of Em Direção à Comparação do Desempenho das Aplicações Paralelas nas Ferramentas OpenStack e OpenNebula

Resumo. A infraestrutura de Computaçãoo em Nuvem vem sendo uma alternativa à a execução de aplica... more Resumo. A infraestrutura de Computaçãoo em Nuvem vem sendo uma alternativa à a execução de aplicações de alto desempenho. No entanto, o desempenho pode ser prejudicado devido a camada de virtualização e da ação das ferramentas de administraç ao de nuvem. O objetivo deste trabalho foi comparar o desempenho de aplicações em OpenStack e OpenNebula. Os resultados apre-sentaram diferença significativa entre as ferramentas e positiva ao OpenNebula.

Research paper thumbnail of Avaliação e Comparação da Computação de Alto Desempenho em Ferramentas OpenSource de Administração de Nuvem Usando Estações de Trabalho

A computação em nuvem está se tornando cada vez mais presente nas infraestruturas empresarias e d... more A computação em nuvem está se tornando cada vez mais presente nas infraestruturas empresarias e diversas ferramentas estão sendo criadas para auxiliar na administração dos recursos computacionais, que lidam diretamente com tecnologias de virtualização. No entanto, com tantas opções para a tomada de decisão, a escolha se torna difícil, devido a falta de informação disponível sobre o desempenho delas. Sendo assim, o objetivo deste trabalho é estudar, implantar e comparar os ambientes das ferramentas de administração de computação em nuvem (OpenStack e OpenNebula), analisando o desempenho de aplicações paralelas e da infraestrutura (usando benchmarks). Além disso, o trabalho buscou identificar se existem diferenças significativas no desempenho na implantação das ferramentas em relação ao ambiente nativo, e também entre elas. Para isto, foram executados testes de avaliação do desempenho da infraestrutura (Memória, disco, rede, e processador) e das aplicações de alto desempenho de cada a...

Research paper thumbnail of Avaliando a Performance das Políticas de Escalonamento de OpenMP no Método de Lattice Boltzmann

In a wide variety of fields in Scientific Computing there is algorithms which demands a hight com... more In a wide variety of fields in Scientific Computing there is algorithms which demands a hight computational costs. An alternative to accelerate the performance of these algorithms consists in a concurrent execution of the code. An important aspect to consider is the way how the tasks are distributed. In the case of OpenMP parallel programming interface, is possible to use different methods of distributing tasks through the schedule clause. In this context, the aim of this work is to evaluate the behavior of scheduling policies of OpenMP. For this purpose, was used the Lattice Boltzmann as a case study. Implementati-ons showed that the use of the schedule clause (guided) get a better performance for the method.

Research paper thumbnail of Estudo Sobre o Impacto de Diferentes Arquiteturas Paralelas na Dinâmica de Fluidos

Através do estudo das propriedades dos líquidos e gases é possível determinar diferentes tipos de... more Através do estudo das propriedades dos líquidos e gases é possível determinar diferentes tipos de fenômenos físicos, tais como: simulação de furacões, previsão de tempo, aerodinâmica e gerenciamento térmico. A evolução dos sistemas computacionais tornou possível resolver estes problemas de forma eficiente através de novas técnicas de simulação. Com isso, alguns métodos e algoritmos foram desenvolvidos para simulações numéricas. Normalmente, o domínio de um problema da dinâmica de fluidos é discretizado, gerando um conjunto de equações lineares que é resolvido através de métodos numéricos. Devido a isso, sistemas multi-core e many-core foram avaliados, para indicar a melhor abordagem para aplicações da dinâmica de fluidos, como o Método de Lattice Boltzmann. O método de Lattice Boltzmann é considerado uma representação discreta da Equação de Boltzmann, sendo esta, a base da teoria cinética dos gases. Nesse método, o comportamento das partículas é representado por uma malha, ou seja, ...

Research paper thumbnail of Simulaçao de Fluxos de Fluidos em GPUs

O framework CUDA tira proveito da arquitetura multithreaded das GPUs. No intuito de avaliar essa ... more O framework CUDA tira proveito da arquitetura multithreaded das GPUs. No intuito de avaliar essa arquitetura, o objetivo do trabalho é avaliar o desempenho de diversas configurações de GPUs para dinâmica dos fluidos. Para tanto, utilizou-se do Método de Lattice Boltzmann, para simulação de escoamento de fluidos. As execuções mostraram que é possível obter um desempenho significativo, tendo um speedup de 175x em relação a versão sequencial.

Research paper thumbnail of Simulação de Fluxos de Fluidos no Intel Xeon Phi

paralela do código. Para isso é necessário reescrevê-lo de forma a expressar o paralelismo. O Int... more paralela do código. Para isso é necessário reescrevê-lo de forma a expressar o paralelismo. O Intel Xeon Phi é uma nova maneira de atender a esses requisitos e pode ser programado com técnicas convencionais de programação paralela. Neste artigo nós avaliamos o desempenho do coprocessador Intel Xeon Phi, a primeira versão da arquitetura Many Integrated Core (MIC) da Intel. Este artigo considera como estado da arte o Método de Lattice Boltzmann, usado para a simulação de dinâmica de fluidos. Os resultados mostram que a interface de programação paralela OpenMP é superior a Cilk em relação à execução de modelos de dinâmica de fluidos no coprocessador Intel Xeon Phi.

Research paper thumbnail of Avaliando Diferentes Interfaces de Programação Paralela em Simulação de Fluxos de Fluidos

Em diversas áreas da Computação Científica existem algoritmos que demandam um elevado custo com-p... more Em diversas áreas da Computação Científica existem algoritmos que demandam um elevado custo com-putacional. Uma alternativa para acelerar a execução destes algoritmos consiste na execução concorrente do código. Usando diferentes interfaces de programação paralela, é possível comparar e analisar um modo de se obter o melhor aproveitamento do hardware e consequentemente prover execuções mais eficientes para os programas. Nesse contexto, o objetivo deste trabalho é avaliar o comportamento de interfaces de programação paralela em memória compar-tilhada para dinâmica dos fluidos. Para tanto, como estudo de caso, utilizou-se do Método de Lattice Boltzmann, para a simulação de escoamento de fluidos. Esse método exige uma significativa quantidade de memória e grande capacidade de processamento. A implementação paralela do método explora o fato das operações serem essencialmente locais, e dessa forma, possíveis de serem executadas concorrentemente. As implementações paralelas do método usand...

Research paper thumbnail of Avaliação de Desempenho do Método de Lattice Boltzmann em Arquiteturas multi-core e many-core

Uma alternativa para acelerar o desempenho de uma variedade de algoritmos consiste na execução pa... more Uma alternativa para acelerar o desempenho de uma variedade de algoritmos consiste na execução paralela do código. O Intel Xeon Phi é uma nova maneira de atender a esses requisitos e pode ser programado com técnicas convencionais como Intel Cilk Plus, OpenMP, POSIX Threads e MPI. Outra abordagem frequentemente utilizada em HPC é a Computação em GPUs com OpenCL e CUDA. Neste artigo nós avaliamos o desempenho de dois aceleradores: Tesla C2075, baseada na arquitetura Fermi desenvolvida pela NVIDIA e o coprocessador Intel Xeon Phi, primeira versão da arquitetura Many Integrated Core. Consideramos como estado da arte o Método de Lattice Boltzmann, usado para a simulação da dinâmica de fluidos. A estrutura regular do algoritmo de Lattice Boltzmann torna fácil de identificar o alto grau de paralelismo. Medimos o desempenho e apresentamos uma comparação com resultados obtidos por implementações anteriores desenvolvidas para multi-core e many-core. Os resultados mostram que programação para GPU e Xeon Phi requerem um esforço semelhante, mas geralmente os resultados são melhores em uma GPU.

Research paper thumbnail of Análise de Desempenho de Aplicações Paralelas em Arquiteturas multi-core e many-core

Simulações numéricas auxiliam no avanço da Ciência e exigem cada vez mais recursos computacionais... more Simulações numéricas auxiliam no avanço da Ciência e exigem cada vez mais recursos computacionais. Quanto maior a resolução de um modelo, mais preciso e custoso serão suas previsões. Nesse contexto, analisamos o desempenho de aplicações desenvolvidas para processadores e aceleradores. Nossos experimentos mostram que em aplicações com pouca comunicação, a GPU Tesla C2075 tem desempenho até 8 vezes maior que duas CPUs de 8 cores cada.

Research paper thumbnail of Nuvem Privada com OpenNebula: da Implantação ao Desenvolvimento

Este é um minicurso ministrado na escola regional de redes de computadores em 2016, sobre implant... more Este é um minicurso ministrado na escola regional de redes de computadores em 2016, sobre implantação de nuvem privada com OpenNebula e um estudo de caso para desenvolvimento de plugins. No caso, foi configurado um monitor de consumo energético de máquinas virtuais.

Research paper thumbnail of 2Instituto de Informática – Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15.064 – 91.501-970 – Porto Alegre – RS – Brasil

Resumo. Webservices são serviços de rede voltados à aplicação. Uma das tecnologias existentes em ... more Resumo. Webservices são serviços de rede voltados à aplicação. Uma das tecnologias existentes em webservices é o protocolo SOAP, responsável pela troca de informações entre dois computadores, o qual pode ser facilmente implementado em diversas linguagens de programação, além de poder usar diferentes protocolos de transmissão. Neste sentido, este trabalho tem por objetivo comparar o desempenho de SOAP através do encapsulamento do seu conteúdo utilizando HTTP, SMTP e BEEP. Os resultados obtidos demonstram que tanto HTTP, quanto BEEP apresentam custos mais baixos de transmissão, cada qual se sobressaindo ao outro, dependendo das características referentes ao tipo de comunicação estabelecida. 1. Introdução Webservices oferecem um novo paradigma para a construção de aplicações web distribuídas [Cerami 2002]. Qualquer serviço disponibilizado sob a Internet que utiliza um sistema de comunicação baseado em XML pode ser considerado um webservice [Elizabeth Castro 2001], independente do siste...

Research paper thumbnail of Paralelismo multi-nível: uma revisão sistemática da literatura

Anais da XXI Escola Regional de Alto Desempenho da Região Sul (ERAD RS 2021)

O paralelismo multi-nível explora diferentes níveis de abstração de hardware a fim de melhorar o d... more O paralelismo multi-nível explora diferentes níveis de abstração de hardware a fim de melhorar o desempenho de aplicações. Ferramentas de programação são destinadas normalmente a apenas um nível de paralelismo, destacando-se a ausência de ferramentas que exploram outros níveis de abstração. Este trabalho apresenta uma revisão sistemática da literatura que investiga ferramentas e frameworks que exploram o paralelismo multinível.

Research paper thumbnail of Ambiente de Nuvem Computacional Privada para Teste e Desenvolvimento de Programas Paralelos

A computação de alto desempenho costuma utilizar agregados de computadores para a execução de apl... more A computação de alto desempenho costuma utilizar agregados de computadores para a execução de aplicações paralelas. Alternativamente, a computação em nuvem oferece recursos computacionais distribuídos para processamento com um nível de abstração além do tradicional, dinâmico e sob-demanda. Este capítulo tem como objetivo introduzir conceitos básicos, apresentar noções básicas para implantar uma nuvem privada e demonstrar os benefícios para o desenvolvimento e teste de programas paralelos em nuvem.

Research paper thumbnail of Aprimorando a Análise de Desempenho de Aplicações Baseadas em Tarefas Irregulares e Árvores de Eliminação

Anais da XXI Escola Regional de Alto Desempenho da Região Sul (ERAD RS 2021)

Este trabalho apresenta os resultados de estratégias de aprimoramento da análise de desempenho de... more Este trabalho apresenta os resultados de estratégias de aprimoramento da análise de desempenho de aplicações baseadas em tarefas com carga de trabalho irregular, através da automação de detecção de tarefas anômalas usando modelos de regressão. Também apresentamos técnicas de visualização de desempenho de aplicações baseadas na estrutura da árvore de eliminação, utilizada na paralelização de algoritmos a de fatoração de matrizes esparsas.

Research paper thumbnail of A New Library of Bio-Inspired Algorithms

Computational Science and Its Applications – ICCSA 2020, 2020

Real engineering, science, and economics problems cannot be ever solved exactly due to the high c... more Real engineering, science, and economics problems cannot be ever solved exactly due to the high computation time to find the optimal solution. One way to solve such problems is to apply bio-inspired algorithms, to minimize the time to search for potential solutions. Bio-inspired algorithms are based on the collective behavior of social organisms and are used to solve optimization problems. This article presents a new library of bio-inspired algorithms. The library offers the implementation of some algorithms, being easily extensible through interfaces. An evaluation was made using 7 test functions applied to each of the implemented algorithms. The tests have shown that the ABC algorithm obtained the best convergence results in 5 tests and the ACO algorithm in 2 tests.

Research paper thumbnail of Operações vetoriais aplicadas em uma Biblioteca de Algoritmos Bio-inspirados

A resolução de um problema pode não ser alcançada de forma exata, devido a complexidade dada por ... more A resolução de um problema pode não ser alcançada de forma exata, devido a complexidade dada por um número elevado de variáveis e/ou soluções potenciais. Uma estratégia para modelar esses problemas é utilizar conceitos de computação natural, também conhecida como computação bio-inspirada. Para acelerar a execução de uma aplicação desse tipo, neste trabalho é aplicada a concorrência das instruções entre as unidades vetoriais na biblioteca bio-inspirada desenvolvida pelos autores, diminuindo o tempo de execução e auxiliando os outros desenvolvedores. Com os resultados dos testes, comprovou-se que a versão com instruções concorrentes dos algoritmos desenvolvidos mantém a qualidade da solução e reduz o tempo de execução.

Research paper thumbnail of Um Monitor de Consumo Energético para Computação em Nuvem na Ferramenta OpenNebula

Anais do XVII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2016)

Nuvens computacionais consomem grandes quantidades de energia elétrica, sendo responsáveis pela e... more Nuvens computacionais consomem grandes quantidades de energia elétrica, sendo responsáveis pela emissão de pelo menos 2% do dióxido de carbono mundial. Por outro lado, as ferramentas de gerenciamento de nuvens atuais não dispõem de recursos para monitorar o consumo energético de suas infraestruturas, bem como não oferecem informações sobre a demanda de energia elétrica, sendo este uma parte integrante do custo de manutenção da nuvem. Portanto, este artigo propõe um modelo de monitoramento energético para nuvens computacionais. Foi criado um addon denominado Monitor Energético (ME) para monitorar o consumo energético em data centers virtualizados, através de Kernel-based Virtual Machine e geridos por OpenNebula. Os experimentos foram realizados com a ferramenta Sysbench para o estresse proposital do ambiente de testes, aonde os resultados comprovaram o bom funcionamento da nossa ferramenta e que ela possui uma visualização intuitiva do monitoramento.

Research paper thumbnail of Uso de Operações SIMD em uma Biblioteca de Algoritmos Bio-inspirados

Anais da Escola Regional de Alto Desempenho da Região Sul (ERAD RS 2020)

Uma estratégia para modelar algoritmicamente um problema é utilizar conceitos de computação natur... more Uma estratégia para modelar algoritmicamente um problema é utilizar conceitos de computação natural, também conhecida como computação bio-inspirada. Neste trabalho é proposta uma biblioteca open source bio-inspirada que utiliza instruções SIMD. Com os resultados dos testes, comprovou-se que a versão paralela dos algoritmos desenvolvidos mantém a qualidade da solução e reduz o tempo de execução.

Research paper thumbnail of An Intra-Cloud Networking Performance Evaluation on CloudStack Environment

2017 25th Euromicro International Conference on Parallel, Distributed and Network-based Processing (PDP), 2017

Infrastructure-as-a-Service (IaaS) is a cloud on-demand commodity built on top of virtualization ... more Infrastructure-as-a-Service (IaaS) is a cloud on-demand commodity built on top of virtualization technologies and managed by IaaS tools. In this scenario, performance is a relevant matter because a set of aspects may impact and increase the system overhead. Specific on the network, the use of virtualized capabilities may cause performance degradation (eg.,latency, throughput). The goal of this paper is to contribute to networking performance evaluation, providing new insights for private IaaS clouds. To achieve our goal, we deploy CloudStack environments and conduct experiments with different configurations and techniques. The research findings demonstrate that KVM-based cloud instances have small network performance degradation regarding throughput (about 0.2% for coarse-grained and 6.8% for fine-grained messages) while container-based instances have even better results. On the other hand, the KVM instances present worst latency (about 12.4% on coarse-grained and two times more on fine-grained messages w. r. t. native environment) and better in container-based instances, where the performance results are close to the native environment. Furthermore, we demonstrate a performance optimization of applications running on KVM.

Research paper thumbnail of Private IaaS Clouds: A Comparative Analysis of OpenNebula, CloudStack and OpenStack

2016 24th Euromicro International Conference on Parallel, Distributed, and Network-Based Processing (PDP), 2016

Despite the evolution of cloud computing in recent years, the performance and comprehensive under... more Despite the evolution of cloud computing in recent years, the performance and comprehensive understanding of the available private cloud tools are still under research. This paper contributes to an analysis of the Infrastructure as a Service (IaaS) domain by mapping new insights and discussing the challenges for improving cloud services. The goal is to make a comparative analysis of OpenNebula, OpenStack and CloudStack tools, evaluating their differences on support for flexibility and resiliency. Also, we aim at evaluating these three cloud tools when they are deployed using a mutual hypervisor (KVM) for discovering new empirical insights. Our research results demonstrated that OpenStack is the most resilient and CloudStack is the most flexible for deploying an IaaS private cloud. Moreover, the performance experiments indicated some contrasts among the private IaaS cloud instances when running intensive workloads and scientific applications.

Research paper thumbnail of Em Direção à Comparação do Desempenho das Aplicações Paralelas nas Ferramentas OpenStack e OpenNebula

Resumo. A infraestrutura de Computaçãoo em Nuvem vem sendo uma alternativa à a execução de aplica... more Resumo. A infraestrutura de Computaçãoo em Nuvem vem sendo uma alternativa à a execução de aplicações de alto desempenho. No entanto, o desempenho pode ser prejudicado devido a camada de virtualização e da ação das ferramentas de administraç ao de nuvem. O objetivo deste trabalho foi comparar o desempenho de aplicações em OpenStack e OpenNebula. Os resultados apre-sentaram diferença significativa entre as ferramentas e positiva ao OpenNebula.

Research paper thumbnail of Avaliação e Comparação da Computação de Alto Desempenho em Ferramentas OpenSource de Administração de Nuvem Usando Estações de Trabalho

A computação em nuvem está se tornando cada vez mais presente nas infraestruturas empresarias e d... more A computação em nuvem está se tornando cada vez mais presente nas infraestruturas empresarias e diversas ferramentas estão sendo criadas para auxiliar na administração dos recursos computacionais, que lidam diretamente com tecnologias de virtualização. No entanto, com tantas opções para a tomada de decisão, a escolha se torna difícil, devido a falta de informação disponível sobre o desempenho delas. Sendo assim, o objetivo deste trabalho é estudar, implantar e comparar os ambientes das ferramentas de administração de computação em nuvem (OpenStack e OpenNebula), analisando o desempenho de aplicações paralelas e da infraestrutura (usando benchmarks). Além disso, o trabalho buscou identificar se existem diferenças significativas no desempenho na implantação das ferramentas em relação ao ambiente nativo, e também entre elas. Para isto, foram executados testes de avaliação do desempenho da infraestrutura (Memória, disco, rede, e processador) e das aplicações de alto desempenho de cada a...

Research paper thumbnail of Avaliando a Performance das Políticas de Escalonamento de OpenMP no Método de Lattice Boltzmann

In a wide variety of fields in Scientific Computing there is algorithms which demands a hight com... more In a wide variety of fields in Scientific Computing there is algorithms which demands a hight computational costs. An alternative to accelerate the performance of these algorithms consists in a concurrent execution of the code. An important aspect to consider is the way how the tasks are distributed. In the case of OpenMP parallel programming interface, is possible to use different methods of distributing tasks through the schedule clause. In this context, the aim of this work is to evaluate the behavior of scheduling policies of OpenMP. For this purpose, was used the Lattice Boltzmann as a case study. Implementati-ons showed that the use of the schedule clause (guided) get a better performance for the method.

Research paper thumbnail of Estudo Sobre o Impacto de Diferentes Arquiteturas Paralelas na Dinâmica de Fluidos

Através do estudo das propriedades dos líquidos e gases é possível determinar diferentes tipos de... more Através do estudo das propriedades dos líquidos e gases é possível determinar diferentes tipos de fenômenos físicos, tais como: simulação de furacões, previsão de tempo, aerodinâmica e gerenciamento térmico. A evolução dos sistemas computacionais tornou possível resolver estes problemas de forma eficiente através de novas técnicas de simulação. Com isso, alguns métodos e algoritmos foram desenvolvidos para simulações numéricas. Normalmente, o domínio de um problema da dinâmica de fluidos é discretizado, gerando um conjunto de equações lineares que é resolvido através de métodos numéricos. Devido a isso, sistemas multi-core e many-core foram avaliados, para indicar a melhor abordagem para aplicações da dinâmica de fluidos, como o Método de Lattice Boltzmann. O método de Lattice Boltzmann é considerado uma representação discreta da Equação de Boltzmann, sendo esta, a base da teoria cinética dos gases. Nesse método, o comportamento das partículas é representado por uma malha, ou seja, ...

Research paper thumbnail of Simulaçao de Fluxos de Fluidos em GPUs

O framework CUDA tira proveito da arquitetura multithreaded das GPUs. No intuito de avaliar essa ... more O framework CUDA tira proveito da arquitetura multithreaded das GPUs. No intuito de avaliar essa arquitetura, o objetivo do trabalho é avaliar o desempenho de diversas configurações de GPUs para dinâmica dos fluidos. Para tanto, utilizou-se do Método de Lattice Boltzmann, para simulação de escoamento de fluidos. As execuções mostraram que é possível obter um desempenho significativo, tendo um speedup de 175x em relação a versão sequencial.

Research paper thumbnail of Simulação de Fluxos de Fluidos no Intel Xeon Phi

paralela do código. Para isso é necessário reescrevê-lo de forma a expressar o paralelismo. O Int... more paralela do código. Para isso é necessário reescrevê-lo de forma a expressar o paralelismo. O Intel Xeon Phi é uma nova maneira de atender a esses requisitos e pode ser programado com técnicas convencionais de programação paralela. Neste artigo nós avaliamos o desempenho do coprocessador Intel Xeon Phi, a primeira versão da arquitetura Many Integrated Core (MIC) da Intel. Este artigo considera como estado da arte o Método de Lattice Boltzmann, usado para a simulação de dinâmica de fluidos. Os resultados mostram que a interface de programação paralela OpenMP é superior a Cilk em relação à execução de modelos de dinâmica de fluidos no coprocessador Intel Xeon Phi.

Research paper thumbnail of Avaliando Diferentes Interfaces de Programação Paralela em Simulação de Fluxos de Fluidos

Em diversas áreas da Computação Científica existem algoritmos que demandam um elevado custo com-p... more Em diversas áreas da Computação Científica existem algoritmos que demandam um elevado custo com-putacional. Uma alternativa para acelerar a execução destes algoritmos consiste na execução concorrente do código. Usando diferentes interfaces de programação paralela, é possível comparar e analisar um modo de se obter o melhor aproveitamento do hardware e consequentemente prover execuções mais eficientes para os programas. Nesse contexto, o objetivo deste trabalho é avaliar o comportamento de interfaces de programação paralela em memória compar-tilhada para dinâmica dos fluidos. Para tanto, como estudo de caso, utilizou-se do Método de Lattice Boltzmann, para a simulação de escoamento de fluidos. Esse método exige uma significativa quantidade de memória e grande capacidade de processamento. A implementação paralela do método explora o fato das operações serem essencialmente locais, e dessa forma, possíveis de serem executadas concorrentemente. As implementações paralelas do método usand...

Research paper thumbnail of Nuvem Privada com OpenNebula: da Implantação ao Desenvolvimento

Escola Regional de Redes de Computadores (ERRC), 2016

Este é um minicurso ministrado na escola regional de redes de computadores em 2016, sobre implant... more Este é um minicurso ministrado na escola regional de redes de computadores em 2016, sobre implantação de nuvem privada com OpenNebula e um estudo de caso para desenvolvimento de plugins. No caso, foi configurado um monitor de consumo energético de máquinas virtuais.

Research paper thumbnail of Uma Ferramenta para Sincronização de Conteúdos Produzidos pelo Software QGIS

Um Sistema de Informações Geográficas (SIG)é um recurso computacional que permite o gerenciamento... more Um Sistema de Informações Geográficas (SIG)é um recurso computacional que permite o gerenciamento de informações através de dados referenciados através de um sistema de coordenadas. Tais sistemas armazenamas informações utilizando dois modos: arquivos ou Banco de Dados. O grupo EIRE armazena dados de recursos energéticos em projetos do SIG QGIS emarquivos de um servidor local. Para possibilitar a sincronização dos dados dearquivos locais utilizados pelo QGIS com um BDé necessário a implementaçãode um plugin para o SIG em questão. Este trabalho descreve o desenvolvimento deste plugin utilizando técnicas de Engenharia de Softwarecomo análise de requisitos, prototipagem, entre outras.