MPEG-G

MPEG-G (ISO / IEC 23092) é um padrão ISO/IEC projetado para representação de informações genômicas pela colaboração do ISO/IEC JTC 1/SC 29 /WG 9 (MPEG) e do ISO TC 276 "Biotechnology" Work Group 5. O objetivo do padrão é fornecer soluções interoperáveis para armazenamento, acesso e proteção de dados em diferentes implementações possíveis para informações de dados geradas por máquinas de sequenciamento de alto rendimento e seu processamento e análise subsequentes.[1][2] O padrão é composto de diferentes partes, cada uma abordando um aspecto específico, como compressão, associação de metadados, Application Programming Interfaces (APIs) e um software de referência para decodificação de dados. Juntamente com o software decodificador de referência, implementações comerciais e de código aberto[3] começaram a estar disponíveis em 2019, cobrindo progressivamente mais partes publicadas do padrão.

Background

O advento das tecnologias de High-throughput methods (HTS) revolucionou o campo da biologia quantitativa. A disponibilidade de grandes coleções de informações genômicas agora faz parte da prática cotidiana e se tornou a base de diversas disciplinas, desde a pesquisa biológica até a medicina personalizada na clínica. Atualmente, as informações genômicas são trocadas principalmente por meio de uma variedade de formatos de dados, como FASTA / FASTQ para leituras de sequenciamento não alinhadas e SAM / BAM / CRAM para leituras alinhadas. O padrão ISO/IEC 23092 (MPEG-G) visa fornecer um formato unificado para a representação e compactação eficientes de dados tão diversos, tanto para armazenamento de arquivos quanto para transporte de dados. Para isso, o padrão é dividido em várias partes.

Estrutura padrão

O padrão MPEG-G utiliza tecnologia e arquiteturas de representação de dados previamente validadas no campo da mídia digital. Eles permitem compactar e transportar dados de sequenciamento do genoma mesmo em cenários complexos, por exemplo, quando é necessário acesso a grandes quantidades de dados possivelmente distribuídos ou quando parte dos dados precisa ser criptografada por motivos de privacidade. Conceitualmente, tais requisitos levam à definição de uma série de mecanismos mutuamente inter-relacionados, que são resumidos na lista a seguir:

  • Formato e compressão de dados[4]
  • Transmissão de dados[4]
  • Concatenação de arquivo compactado[4]
  • Atualização incremental de dados de sequenciamento e metadados[4]
  • Acesso seletivo a dados compactados, por exemplo, consultas rápidas por intervalo genômico[5]
  • Associação de metadados[6]
  • Aplicação das regras de privacidade[6]
  • Criptografia seletiva de dados e metadados[6]
  • Anotação e ligação de segmentos genômicos.[7]

Por sua vez, alguns desses tópicos foram reunidos para tornar o padrão mais fácil de entender e implementar. Como resultado, a norma ISO/IEC 23092 é fisicamente estruturada como uma série de documentos separados, da seguinte forma:

MPEG-G Parts
Parte Número Primeira data de lançamento público (primeira edição) Última data de lançamento público (edição) Última alteração Título Descrição
Part 1 ISO/IEC 23092-1 2019 2019 Transporte e armazenamento de informações genômicas Especificação do formato de arquivo, streaming e indexação[4]
Part 2 ISO/IEC 23092-2 2019 2019 Codificação de Informação Genômica Compressão de dados de sequenciamento do genoma não mapeados (brutos) e alinhados[5]
Part 3 ISO/IEC 23092-3 2020 2020 Metadados e Application Programming Interfaces (APIs) Especificação de interfaces padrão, sintaxe para metadados e descrição de mecanismos de proteção de conteúdo[6]
Part 4 ISO/IEC 23092-4 (2020) Software de referência Ele descreve a implementação de código aberto de um decodificador normativo e codificador informativo. Ele também fornece fluxos de bits compactados que podem ser usados ​​para fins de referência. Observe que existem outras implementações de código aberto desenvolvidas por grupos independentes[8][9]
Part 5 ISO/IEC 23092-5 (2020) Teste de conformidade Ele detalha o procedimento de teste e os fluxos de bits de referência compactados associados a serem usados ​​quando se deseja avaliar a conformidade de uma implementação de decodificador com o padrão MPEG-G[10]
Part 6 ISO/IEC 23092-6 (2021) Codificação de anotações genômicas Representação compactada de anotações genômicas — ou seja, uma série de tipos de dados heterogêneos associados a intervalos do genoma de referência aos quais os dados de sequenciamento foram alinhados.[7]

ISO/IEC 23092-1 MPEG-G Part 1

A ISO/IEC 23092-1 especifica como os dados genômicos são organizados dentro de estruturas MPEG-G para transporte (ou seja, streaming) e armazenamento. Os formatos de registro genômico, registro de referência, arquivo MPEG-G e fluxo de transporte são definidos nesta parte. Ele apresenta o Access Unit como o contêiner dos dados genômicos compactados e fornece um processo de conversão de referência entre diferentes formatos.

ISO/IEC 23092-2 MPEG-G Part 2

A ISO/IEC 23092-2 especifica a sintaxe e os métodos para compressão sem perdas MPEG-G de dados de sequenciamento e compressão com perdas de pontuações de qualidade associadas. O MPEG-G, como é típico dos padrões MPEG, especifica apenas o processo de decodificação, enquanto o processo de codificação é deixado aberto a inovações algorítmicas e específicas de implementação. Todos os decodificadores compatíveis com MPEG-G produzem saídas idênticas dos fluxos de bits multiplexados incluídos nos arquivos MPEG-G e dos fluxos de dados em cenários de streaming.

Os dados de entrada do codificador são registros genômicos ou metadados, com dados de referência opcionais, enquanto sua saída é um arquivo MPEG-G ou fluxos de transporte.

ISO/IEC 23092-3 MPEG-G Part 3

A ISO/IEC 23092-3 especifica um formato de metadados e fornece APIs de representação de dados genômicos para dar suporte à interoperabilidade entre ferramentas e sistemas existentes. A Parte 3 especifica como um fluxo de bits compatível com MPEG-G pode ser integrado com metadados, bem como mecanismos para implementar controle de acesso, verificação de integridade, autenticação e mecanismos de autorização. Esta parte também contém uma seção informativa dedicada ao mapeamento entre estruturas de dados SAM e MPEG-G, incluindo compatibilidade com versões anteriores do conteúdo SAM existente. Ele define:

Grupos de funções de API
Grupo de funções Breve Descrição
Informação Genômica Funções usadas para consultar a estrutura e recuperar as informações genômicas codificadas em um fluxo de bits compatível com a série ISO/IEC 23092.
Metadados Funções usadas para consultar a estrutura e recuperar os metadados associados aos dados genômicos codificados.
Proteção Funções usadas para recuperar os metadados de proteção associados aos dados genômicos codificados.
Referência Funções usadas para recuperar a referência associada a um conjunto de dados.
Estatísticas Funções usadas para recuperar estatísticas associadas a um conjunto de dados.

ISO/IEC 23092-4 MPEG-G Part 4

A ISO/IEC 23092-4[9] especifica um software de referência para representação de informações genômicas, denominado modelo genômico (GM). Ele consiste em dois componentes: o software codificador de referência e o software decodificador de referência. Embora o software decodificador de referência seja fornecido para avaliar a conformidade com os requisitos da ISO/IEC 23092-1,[4] ISO/IEC 23092-2[5] e ISO/IEC 23092-6,[7] o software codificador de referência serve como um guia para a implementação dos padrões acima mencionados. O software codificador de referência chamado Genie[3] é um software de código aberto desenvolvido por um grupo de indivíduos de várias universidades e empresas ao redor do mundo. Ele apresenta os seguintes componentes:

Componentes de software de referência
Parte Número Componente Descrição
Part 1[4] ISO/IEC 23092-1 Encapsulamento
Indexação
Part 2[5] ISO/IEC 23092-2 Classificação
Motor de referência
Quantização do valor da qualidade
Geração de subsequência de descritor
Transformações
Codificação de entropia
Part 6 ISO/IEC 23092-6 (A ser determinado)

ISO/IEC 23092-5 MPEG-G Part 5

A ISO/IEC 23092-5 especifica a conformidade da codificação de informações genômicas. A Parte 5 fornece um meio de testar e validar a implementação correta da tecnologia MPEG-G em diferentes dispositivos e aplicativos para garantir a interoperabilidade entre todos os sistemas. Ele especifica um procedimento normativo para avaliar a conformidade com o padrão em um conjunto exaustivo de dados compactados.

Tipo MIME e extensões de nome de arquivo

Nenhum tipo MIME (tipo de mídia IANA baseado em RFC 6838) definido atualmente para arquivo MPEG-G.

Nenhuma extensão de arquivo convencional é definida.

Ver também

Referências

  1. Alberti, Claudio; Paridaens, Tom; Voges, Jan; Naro, Daniel; Ahmad, Junaid; Ravasi, Massimo; Renzi, Daniele; Zoia, Giorgio; Ribeca, Paolo (Outubro de 2018). «An introduction to MPEG-G, the new ISO standard for genomic information representation». bioRxiv: 426353. doi:10.1101/426353. Consultado em 14 de novembro de 2024 
  2. Hernaez, Mikel; Pavlichin, Dmitri; Weissman, Tsachy; Ochoa, Idoia (20 de julho de 2019). «Genomic Data Compression». Annual Review of Biomedical Data Science. 2 (1): 19–37. ISSN 2574-3414. doi:10.1146/annurev-biodatasci-072018-021229Acessível livremente. Consultado em 14 de novembro de 2024 
  3. a b «Genie, Open Source MPEG-G Codec». GitHub. 22 de junho de 2021 
  4. a b c d e f g «ISO/IEC 23092-1 Transport and Storage of Genomic Information» 
  5. a b c d «ISO/IEC 23092-2 Coding of Genomic Information» 
  6. a b c d «ISO/IEC 23092-3 Metadata and APIs» 
  7. a b c «ISO/IEC 23092-6 Coding of Genomic Annotations» 
  8. Brian Bliss; Joshua Allen; Saurabh Baheti; Matthew Bockol; Jaime Delgado; Jan Fostier; Josep Gelpi; Steven Hart; Mikel Hernaez; Matthew Hudson; Michael Kalmbach; Eric Klee; Liudmila Mainzer; Fabian Müntefering; Daniel Naro; Idoia Ochoa; Joern Ostermann; Tom Paridaens; Christian Ross; Jan Voges; Eric Wieben; Mingyu Yang; Tsachy Weissman; Mathieu Wiepert (Novembro de 2019). Genie: an MPEG-G conformant software to compress genomic data (PDF). sc19.supercomputing.org. doi:10.1101/426353 
  9. a b «ISO/IEC 23092-4 Reference Software» 
  10. «ISO/IEC 23092-5 Conformance» 

Ligações externas

Read other articles:

Vegetarian restaurant in New York Dirt CandyLocation within ManhattanRestaurant informationEstablished2008Owner(s)Amanda CohenChefAmanda CohenFood typeVegetarianRating Michelin Guide[1]Street address86 Allen Street, in the Lower East Side, ManhattanCityNew York CityPostal/ZIP Code10002CountryUnited StatesCoordinates40°43′05″N 73°59′27″W / 40.717929°N 73.990738°W / 40.717929; -73.990738Websitedirtcandynyc.com Dirt Candy is a vegetarian restaurant in ...

 

2010 studio album by Exit StateDeath of a RockstarStudio album by Exit StateReleasedMay 31, 2010 (2010-05-31)GenreRock, metal, hard rock, Alternative rockLength34 minsLabelKing Prawn RecordsProducerSteve FentonExit State chronology Bad Days(2009) Death of a Rockstar(2010) Black Veins(2011) Singles from Death of a Rockstar Bad DaysReleased: 29.06.09 Lost Beyond BeliefReleased: 12.04.10 Professional ratingsReview scoresSourceRatingMudkiss Fanzine(Positive)[1]DSD&#...

 

Дуб Мєшко І Dąb Mieszko I Статус: Ботанічна пам'ятка природи Заснування: — Географічні координати: 51°57′49″ пн. ш. 14°45′51″ сх. д. / 51.9638167° пн. ш. 14.7643444° сх. д. / 51.9638167; 14.7643444Координати: 51°57′49″ пн. ш. 14°45′51″ сх. д. / 51.9638167° пн. ...

Pour les articles homonymes, voir Dorchester. Cet article est une ébauche concernant une localité anglaise. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants. DorchesterGéographiePays  Royaume-UniNation constitutive AngleterreRégion Angleterre du Sud-OuestComté cérémonial DorsetZone Dorset (en)Capitale de DorsetSuperficie 4,92 km2Altitude 55 mCoordonnées 50° 42′ 39″ N, 2° 26′...

 

Artikel ini perlu dikembangkan agar dapat memenuhi kriteria sebagai entri Wikipedia.Bantulah untuk mengembangkan artikel ini. Jika tidak dikembangkan, artikel ini akan dihapus. Artikel ini sebagian besar atau seluruhnya berasal dari satu sumber. Tolong bantu untuk memperbaiki artikel ini dengan menambahkan rujukan ke sumber lain yang tepercaya. Normoglikemia adalah kadar glukosa darah sekitar 66 sampai 140 mg/dl.[1] Referensi ^ Patient factors, not physician or clinic factors, ac...

 

تيلابيري     الإحداثيات 14°13′00″N 1°27′00″E / 14.216666666667°N 1.45°E / 14.216666666667; 1.45  تقسيم إداري  البلد النيجر[1]  التقسيم الأعلى النيجر  العاصمة تيلابيري  [لغات أخرى]‏  خصائص جغرافية  المساحة 89623.0 كيلومتر مربع  عدد السكان  عدد السكان 2722482 ...

Émile BlazerBiographieNaissance 8 mars 1859MontbéliardDécès 19 avril 1941 (à 82 ans)MontbéliardFormation LycéeActivités Écrivain, folkloriste, conservateur de muséeAutres informationsMembre de Société d'Émulation de Montbéliardmodifier - modifier le code - modifier Wikidata Émile Blazer (1859-1941) est un auteur, folkloriste et conservateur de musée montbéliardais. Biographie Émile Blazer naît à Montbéliard le 8 mars 1859 dans le foyer d'un graveur en horlogerie. Il ...

 

此條目需要补充更多来源。 (2022年1月19日)请协助補充多方面可靠来源以改善这篇条目,无法查证的内容可能會因為异议提出而被移除。致使用者:请搜索一下条目的标题(来源搜索:改利根級重巡洋艦 — 网页、新闻、书籍、学术、图像),以检查网络上是否存在该主题的更多可靠来源(判定指引)。 改利根級 かいとね概觀艦種重巡洋艦擁有國 大日本帝国計劃數2艘取

 

Election 2004 European Parliament election in the United Kingdom ← 1999 10 June 2004 2009 → ← outgoing memberselected members →All 78 of the United Kingdom's seats in the European ParliamentTurnout38.5%[1] 14.5%   First party Second party Third party   Leader Jonathan Evans Gary Titley Roger Knapman Party Conservative Labour UKIP Alliance EPP PES IND/DEM Leader since 14 December 2001 2002 5 October 2002 Leader's seat Wale...

Principado do Liechtenstein Este artigo é parte da série: Política e governo daLiechtenstein Constituição Príncipe Hans-Adam II Príncipe-regente Alois, príncipe herdeiro Primeiro-ministro Adrian Hasler Landtag Presidente Albert Frick Partidos políticos Eleições: 2009, 2013, 2017, 2021 Subdivisões Relações exteriores  · Atlas verdiscutireditar

 

宮城県にある「みやぎ東日本大震災津波伝承館」とは異なります。 東日本大震災津波伝承館Iwate Tsunami Memorial Museum 外観 岩手県内の位置施設情報愛称 いわてTSUNAMIメモリアル館長 達増拓也[1]事業主体 岩手県延床面積 7,079 m2[2]開館 2019年9月22日所在地 〒029-2204岩手県陸前高田市気仙町字土手影180番地(高田松原津波復興祈念公園内)位置 北緯39度00分26.5秒 東経1...

 

Species of moth Monopis monachella Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Arthropoda Class: Insecta Order: Lepidoptera Family: Tineidae Genus: Monopis Species: M. monachella Binomial name Monopis monachella(Hübner, 1796) Synonyms Tinea monachella Hubner, 1796 Alucita mediella Fabricius, 1794 Monopis monachella is a moth of the family Tineidae. It is widespread in Eurasia, Africa, India, Sri Lanka, Burma, Sumatra, Java, the Philippines, Taiwan, Japan, New G...

Historic theatre in Launceston, Tasmania This article is about the historic theatre in Launceston, Tasmania. For other uses, see Majestic Theatre. Majestic TheatreThe Majestic Theatre in 1917Address76 Brisbane StreetLaunceston, TasmaniaAustraliaCoordinates41°26′11.5″S 147°8′22.85″E / 41.436528°S 147.1396806°E / -41.436528; 147.1396806OwnerNeil Pitts MenswareCapacity1,510ConstructionOpened2 June 1917; 106 years ago (1917-06-02)Closed28 ...

 

Californian hot sauce brand This article does not cite any sources. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Scorpion Bay Hot Sauce – news · newspapers · books · scholar · JSTOR (June 2015) (Learn how and when to remove this template message) Scorpion Bay Hot SauceIndustryFood processingFounderRob BurnsHeadquartersSan Diego, California, United StatesProducts...

 

1958 film Andy Hardy Comes HomeDirected byHoward W. KochWritten byEdward Everett HutshingRobert Morris Donleyadditional dialogueHarry RuskinBased oncharacters created by Aurania RouverolProduced byRed DoffStarringMickey RooneyPatricia BreslinFay HoldenCinematographyWilliam W. SpencerHarold E. WellmanEdited byJohn Baxter RogersMusic byVan AlexanderProductioncompanyFryman EnterprisesDistributed byMetro-Goldwyn-MayerRelease date22 December 1958Running time80 minutesCountryUnited StatesLanguageEn...

Norwegian film director and journalist Leif SindingBorn(1895-11-19)19 November 1895NorwayDied13 May 1985(1985-05-13) (aged 89)NorwayOccupation(s)Film director, journalistSpouseEllen Buttedahl From left, Rolf Jørgen Fuglesang, Gulbrand Lunde, Bjarne Holst, Vidkun Quisling, Anders Beggerud and director Leif Sinding, during a visit to Statens Filmdirektorat in 1942. Leif Sinding (19 November 1895 – 13 May 1985) was a Norwegian film director and journalist. He worked for the newspapers Ve...

 

1949–1955 military governing body over West Germany Not to be confused with the Allied High Commission for the occupation of Istanbul (1918-1923). The Allied High Commission (also known as the High Commission for Occupied Germany, HICOG; in German Alliierte Hohe Kommission, AHK) was established by the United States, the United Kingdom, and France after the 1948 breakdown of the Allied Control Council, to regulate and supervise the development of the newly established Federal Republic of Ger...

 

2009 single by Akon BeautifulSingle by Akon featuring Colby O'Donis and Kardinal Offishallfrom the album Freedom ReleasedJanuary 6, 2009 (2009-01-06)Recorded2008GenreDance-popLength5:12 (album version)3:51 (radio edit)3:19 (UK radio edit)Label Konvict Muzik Universal Motown Songwriter(s) Colby Colón Jason Harrow Aliaune Thiam Jaylien Wesley Giorgio Tuinfort Producer(s) Akon Jaylien Akon singles chronology What's Love (2008) Beautiful (2009) Day Dreaming (2009) Colby O'Doni...

This article does not cite any sources. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Sanghamithra Superfast Express – news · newspapers · books · scholar · JSTOR (March 2011) (Learn how and when to remove this template message) Sanghamitra Superfast ExpressOverviewService typeSuperfast ExpressLocaleKarnataka, Tamil Nadu, Andhra Pradesh, Telangana, Maharashtra, M...

 

American actress This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This biography of a living person needs additional citations for verification. Please help by adding reliable sources. Contentious material about living persons that is unsourced or poorly sourced must be removed immediately from the article and its talk page, especially if potentially libelous.Find sources: Christina S...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!