1. Identificação | |
Tipo de Referência | Tese ou Dissertação (Thesis) |
Site | mtc-m16.sid.inpe.br |
Código do Detentor | isadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S |
Identificador | 6qtX3pFwXQZ3P8SECKy/y9J8L |
Repositório | sid.inpe.br/jeferson/2003/05.15.11.23 |
Última Atualização | 2017:11.01.11.36.44 (UTC) simone |
Repositório de Metadados | sid.inpe.br/jeferson/2003/05.15.11.23.56 |
Última Atualização dos Metadados | 2024:12.26.14.39.49 (UTC) administrator |
Chave Secundária | INPE-10297-TDI/916 |
Chave de Citação | Fernandes:2003:PrOtPr |
Título | Um processo otimizado de produção de mapas da radiação cósmica de fundo em microondas |
Título Alternativo | An optimized process of production of cosmic microwave backgroud radiation maps |
Curso | CAP-SPG-INPE-MCT-BR |
Ano | 2003 |
Data Secundária | 20030314 |
Data | 2003-03-27 |
Data de Acesso | 26 dez. 2024 |
Tipo da Tese | Dissertação (Mestrado em Computação Aplicada) |
Tipo Secundário | TDI |
Número de Páginas | 97 |
Número de Arquivos | 201 |
Tamanho | 11667 KiB |
|
2. Contextualização | |
Autor | Fernandes, José Oscar |
Grupo | CAP-SPG-INPE-MCT-BR |
Banca | Velho, Haroldo Fraga de Campos (presidente) Preto, Airam Jônatas (orientador) Stephany, Stephan (orientador) Wuensche, Carlos Alexandre Figueiredo Filho, Newton de |
Universidade | Instituto Nacional de Pesquisas Espaciais (INPE) |
Cidade | São José dos Campos |
Histórico (UTC) | 2008-08-21 20:58:54 :: administrator -> jefferson :: 2009-04-27 19:28:06 :: jefferson -> administrator :: 2009-05-02 03:09:24 :: administrator -> marciana :: 2009-06-10 20:15:28 :: marciana -> administrator :: 2009-07-08 21:18:39 :: administrator -> marciana :: 2009-07-09 15:57:58 :: marciana -> administrator :: 2009-08-12 00:24:52 :: administrator -> marciana :: 2012-07-18 13:30:22 :: marciana -> administrator :: 2016-06-04 20:02:39 :: administrator -> marciana :: 2003 2017-11-01 11:34:16 :: marciana -> sergio :: 2003 2017-11-01 11:37:29 :: sergio -> administrator :: 2003 2018-06-05 01:20:25 :: administrator -> sergio :: 2003 2019-05-14 14:17:50 :: sergio -> simone :: 2003 2019-05-14 14:18:10 :: simone -> administrator :: 2003 2024-12-26 14:39:49 :: administrator -> :: 2003 |
|
3. Conteúdo e estrutura | |
É a matriz ou uma cópia? | é a matriz |
Estágio do Conteúdo | concluido |
Transferível | 1 |
Palavras-Chave | radiação cósmica de fundo em microondas (RCFM) sistemas de processamento paralelo redução de dados FORTRAN (linguagem de programação) programação de sistemas computacionais |
Resumo | Este trabalho propõe uma estratégia de otimização de desempenho para o software de produção de mapas da Radiação Cósmica de Fundo em Microondas (RCFM), onde se busca a minimização do tempo de processamento utilizando uma arquitetura paralela de memória distribuída. Inicialmente, um código desenvolvido em Fortran foi portado para Fortran 90 e High Performance Fortran (HPF), em uma implementação baseada em paralelismo de dados, sendo executado em uma arquitetura paralela de memória compartilhada. O código foi convenientemente dividido em trechos e foi instrumentado para prover informações dos tempos de execução de cada trecho. A análise dos tempos de execução mostrou um "gargalo" de desempenho nas rotinas que implementam a convolução de matrizes, o que é feito por um algoritmo Fast Fourier Transform (FFT) bidimensional. Esta rotina é a maior consumidora de tempo de CPU devido à distribuição de dados entre os processadores. No algoritmo FFT, a matriz de convolução deve ser transposta. Tipicamente, um bloco de colunas desta matriz é atribuído a cada processador, mas no cálculo da matriz transposta, blocos de linhas da mesma matriz devem ser lidos. Isto é claramente, uma operação pouco eficiente quando se utiliza o HPF. A rotina FFT foi portada para Message Passing Interface (MPI), combinando paralelismo de dados e tarefas. A arquitetura paralela de memória distribuída utilizada é um beowulf cluster de 16 nós, sendo cada nó um computador Linux IA-32. O uso de MPI para melhorar o desempenho do HPF foi proposto por Foster et al. em ?Double standards: bringing task parallelism to HPF via the Message Passing Interface? e foi utilizado em uma rotina 2D-FFT com o objetivo de proporcionar uma comunicação mais eficiente entre os nós no cálculo de uma matriz transposta. Este trabalho apresenta as avaliações do método utilizado, que pode ser aplicado a outras rotinas consumidoras de tempo de CPU. A análise dos tempos de execução fornece indícios para se conseguir um melhor balanceamento de carga e menor tempo de comunicação entre os nós. ABSTRACT: The current work describes the optimization and parallelization of the software for the production of Cosmic Microwave Background (CMB) radiation maps in a distributed memory architecture. Initially, the Fortran code was ported to Fortran 90 and to High Performance Fortran (HPF) and run in a SMP (Shared Memory Processor) machine. In order to provide timing information, calls to operating system timing routines were imbedded in the code. Analysis of timing information shows performance bottlenecks in the matrix convolution routine, which is done by a two-dimensional Fast Fourier Transform (FFT) algorithm. This is a time consuming routine due to data distribution among processors. Due to the FFT algorithm the convolution matrix has to be transposed. Typically, a block of columns of this matrix is assigned to each processor but, in order to calculate the transposed matrix, block of lines of the same matrix must be read. This was clearly an inefficient issue running HPF on that machine. The FFT routine was ported to Message Passing Interface (MPI) mixing task and data parallelism. The used distributed memory machine is a Beowulf cluster, each node being a Linux IA-32 computer. The use of MPI to enhance HPF performance was already proposed by Foster et al. in ?Double standards: bringing task parallelism to HPF via the Message Passing Interface? and was used in the 2D FFT routine in order to provide a more efficient communication between nodes in the calculation of the transposed matrix. This work presents the evaluations of the used method, and the same approach could be used in other time consuming routines of the CMB code. The timing analysis provides clues to enhance load balancing and data communication between nodes. |
Área | COMP |
Arranjo | urlib.net > BDMCI > Fonds > Produção pgr ATUAIS > CAP > Um processo otimizado... |
Conteúdo da Pasta doc | acessar |
Conteúdo da Pasta source | publicacao.pdf | 18/07/2018 10:21 | 1.3 MiB | |
Conteúdo da Pasta agreement | |
|
4. Condições de acesso e uso | |
URL dos dados | http://urlib.net/ibi/6qtX3pFwXQZ3P8SECKy/y9J8L |
URL dos dados zipados | http://urlib.net/zip/6qtX3pFwXQZ3P8SECKy/y9J8L |
Idioma | pt |
Arquivo Alvo | publicacao.pdf |
Grupo de Usuários | administrator marciana sergio simone |
Visibilidade | shown |
Licença de Direitos Autorais | urlib.net/www/2012/11.12.15.10 |
Detentor dos Direitos | originalauthor yes |
Detentor da Cópia | SID/SCD |
Permissão de Leitura | allow from all |
Permissão de Atualização | não transferida |
|
5. Fontes relacionadas | |
Unidades Imediatamente Superiores | 8JMKD2USNNW34T/4CL6M65 8JMKD3MGPCW/3F2PHGS |
Lista de Itens Citando | sid.inpe.br/bibdigital/2013/10.12.22.16 5 |
Divulgação | NTRSNASA; BNDEPOSITOLEGAL. |
Acervo Hospedeiro | sid.inpe.br/banon/2003/08.15.17.40 |
|
6. Notas | |
Campos Vazios | academicdepartment affiliation archivingpolicy archivist callnumber contenttype creatorhistory descriptionlevel doi e-mailaddress electronicmailaddress format isbn issn label lineage mark mirrorrepository nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid schedulinginformation secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype |
|