Fechar

1. Identificação
Tipo de ReferênciaTese ou Dissertação (Thesis)
Sitemtc-m16.sid.inpe.br
Código do Detentorisadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S
Identificador6qtX3pFwXQZ3P8SECKy/y9J8L
Repositóriosid.inpe.br/jeferson/2003/05.15.11.23
Última Atualização2017:11.01.11.36.44 (UTC) simone
Repositório de Metadadossid.inpe.br/jeferson/2003/05.15.11.23.56
Última Atualização dos Metadados2024:12.26.14.39.49 (UTC) administrator
Chave SecundáriaINPE-10297-TDI/916
Chave de CitaçãoFernandes:2003:PrOtPr
TítuloUm processo otimizado de produção de mapas da radiação cósmica de fundo em microondas
Título AlternativoAn optimized process of production of cosmic microwave backgroud radiation maps
CursoCAP-SPG-INPE-MCT-BR
Ano2003
Data Secundária20030314
Data2003-03-27
Data de Acesso26 dez. 2024
Tipo da TeseDissertação (Mestrado em Computação Aplicada)
Tipo SecundárioTDI
Número de Páginas97
Número de Arquivos201
Tamanho11667 KiB
2. Contextualização
AutorFernandes, José Oscar
GrupoCAP-SPG-INPE-MCT-BR
BancaVelho, Haroldo Fraga de Campos (presidente)
Preto, Airam Jônatas (orientador)
Stephany, Stephan (orientador)
Wuensche, Carlos Alexandre
Figueiredo Filho, Newton de
UniversidadeInstituto Nacional de Pesquisas Espaciais (INPE)
CidadeSão José dos Campos
Histórico (UTC)2008-08-21 20:58:54 :: administrator -> jefferson ::
2009-04-27 19:28:06 :: jefferson -> administrator ::
2009-05-02 03:09:24 :: administrator -> marciana ::
2009-06-10 20:15:28 :: marciana -> administrator ::
2009-07-08 21:18:39 :: administrator -> marciana ::
2009-07-09 15:57:58 :: marciana -> administrator ::
2009-08-12 00:24:52 :: administrator -> marciana ::
2012-07-18 13:30:22 :: marciana -> administrator ::
2016-06-04 20:02:39 :: administrator -> marciana :: 2003
2017-11-01 11:34:16 :: marciana -> sergio :: 2003
2017-11-01 11:37:29 :: sergio -> administrator :: 2003
2018-06-05 01:20:25 :: administrator -> sergio :: 2003
2019-05-14 14:17:50 :: sergio -> simone :: 2003
2019-05-14 14:18:10 :: simone -> administrator :: 2003
2024-12-26 14:39:49 :: administrator -> :: 2003
3. Conteúdo e estrutura
É a matriz ou uma cópia?é a matriz
Estágio do Conteúdoconcluido
Transferível1
Palavras-Chaveradiação cósmica de fundo em microondas (RCFM)
sistemas de processamento paralelo
redução de dados
FORTRAN (linguagem de programação)
programação de sistemas computacionais
ResumoEste trabalho propõe uma estratégia de otimização de desempenho para o software de produção de mapas da Radiação Cósmica de Fundo em Microondas (RCFM), onde se busca a minimização do tempo de processamento utilizando uma arquitetura paralela de memória distribuída. Inicialmente, um código desenvolvido em Fortran foi portado para Fortran 90 e High Performance Fortran (HPF), em uma implementação baseada em paralelismo de dados, sendo executado em uma arquitetura paralela de memória compartilhada. O código foi convenientemente dividido em trechos e foi instrumentado para prover informações dos tempos de execução de cada trecho. A análise dos tempos de execução mostrou um "gargalo" de desempenho nas rotinas que implementam a convolução de matrizes, o que é feito por um algoritmo Fast Fourier Transform (FFT) bidimensional. Esta rotina é a maior consumidora de tempo de CPU devido à distribuição de dados entre os processadores. No algoritmo FFT, a matriz de convolução deve ser transposta. Tipicamente, um bloco de colunas desta matriz é atribuído a cada processador, mas no cálculo da matriz transposta, blocos de linhas da mesma matriz devem ser lidos. Isto é claramente, uma operação pouco eficiente quando se utiliza o HPF. A rotina FFT foi portada para Message Passing Interface (MPI), combinando paralelismo de dados e tarefas. A arquitetura paralela de memória distribuída utilizada é um beowulf cluster de 16 nós, sendo cada nó um computador Linux IA-32. O uso de MPI para melhorar o desempenho do HPF foi proposto por Foster et al. em ?Double standards: bringing task parallelism to HPF via the Message Passing Interface? e foi utilizado em uma rotina 2D-FFT com o objetivo de proporcionar uma comunicação mais eficiente entre os nós no cálculo de uma matriz transposta. Este trabalho apresenta as avaliações do método utilizado, que pode ser aplicado a outras rotinas consumidoras de tempo de CPU. A análise dos tempos de execução fornece indícios para se conseguir um melhor balanceamento de carga e menor tempo de comunicação entre os nós. ABSTRACT: The current work describes the optimization and parallelization of the software for the production of Cosmic Microwave Background (CMB) radiation maps in a distributed memory architecture. Initially, the Fortran code was ported to Fortran 90 and to High Performance Fortran (HPF) and run in a SMP (Shared Memory Processor) machine. In order to provide timing information, calls to operating system timing routines were imbedded in the code. Analysis of timing information shows performance bottlenecks in the matrix convolution routine, which is done by a two-dimensional Fast Fourier Transform (FFT) algorithm. This is a time consuming routine due to data distribution among processors. Due to the FFT algorithm the convolution matrix has to be transposed. Typically, a block of columns of this matrix is assigned to each processor but, in order to calculate the transposed matrix, block of lines of the same matrix must be read. This was clearly an inefficient issue running HPF on that machine. The FFT routine was ported to Message Passing Interface (MPI) mixing task and data parallelism. The used distributed memory machine is a Beowulf cluster, each node being a Linux IA-32 computer. The use of MPI to enhance HPF performance was already proposed by Foster et al. in ?Double standards: bringing task parallelism to HPF via the Message Passing Interface? and was used in the 2D FFT routine in order to provide a more efficient communication between nodes in the calculation of the transposed matrix. This work presents the evaluations of the used method, and the same approach could be used in other time consuming routines of the CMB code. The timing analysis provides clues to enhance load balancing and data communication between nodes.
ÁreaCOMP
Arranjourlib.net > BDMCI > Fonds > Produção pgr ATUAIS > CAP > Um processo otimizado...
Conteúdo da Pasta docacessar
Conteúdo da Pasta source
publicacao.pdf 18/07/2018 10:21 1.3 MiB
Conteúdo da Pasta agreement
Autorizacao.pdf 01/11/2017 09:36 889.3 KiB 
4. Condições de acesso e uso
URL dos dadoshttp://urlib.net/ibi/6qtX3pFwXQZ3P8SECKy/y9J8L
URL dos dados zipadoshttp://urlib.net/zip/6qtX3pFwXQZ3P8SECKy/y9J8L
Idiomapt
Arquivo Alvopublicacao.pdf
Grupo de Usuáriosadministrator
marciana
sergio
simone
Visibilidadeshown
Licença de Direitos Autoraisurlib.net/www/2012/11.12.15.10
Detentor dos Direitosoriginalauthor yes
Detentor da CópiaSID/SCD
Permissão de Leituraallow from all
Permissão de Atualizaçãonão transferida
5. Fontes relacionadas
Unidades Imediatamente Superiores8JMKD2USNNW34T/4CL6M65
8JMKD3MGPCW/3F2PHGS
Lista de Itens Citandosid.inpe.br/bibdigital/2013/10.12.22.16 5
DivulgaçãoNTRSNASA; BNDEPOSITOLEGAL.
Acervo Hospedeirosid.inpe.br/banon/2003/08.15.17.40
6. Notas
Campos Vaziosacademicdepartment affiliation archivingpolicy archivist callnumber contenttype creatorhistory descriptionlevel doi e-mailaddress electronicmailaddress format isbn issn label lineage mark mirrorrepository nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid schedulinginformation secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype


Fechar