Área de stage (datos)

Un área de stage (se puede traducir como área de pruebas o área de ensayo), también llamada zona de landing (zona de aterrizaje), es un área intermedia de almacenamiento de datos utilizada para el procesamiento de los mismos durante procesos de extracción, transformación y carga (ETL). Esta área se encuentra entre la fuente de los datos y su destino, que a menudo son almacenes de datos, data marts u otros repositorios de datos.[1]

Las áreas de stage de datos son a menudo de naturaleza transitoria, su contenido se borrará antes de ejecutar un proceso de ETL o inmediatamente después de haberlo finalizado con éxito. Aunque existen arquitecturas de área stage diseñadas para mantener los datos durante largos períodos de tiempo con la finalidad de mantener un archivo de los mismos o para poder resolver problemas detectados a posteriori.

Implementación

Las áreas de stage se pueden implementar en forma de tablas de bases de datos relacionales, archivos de texto plano (como archivos XML o CSV) o archivos binarios propietarios almacenados en un determinado sistema de archivos.[2]​ Las arquitecturas para área de stage varían en complejidad, desde un conjunto de simples tablas relacionales en una base de datos de destino hasta instancias de bases de datos auto-contenidas o sistemas de archivos.[3]​ A pesar de que los sistemas de origen y de destino de un proceso ETL son a menudo bases de datos relacionales, no es necesario las zonas de stage' 'que se ubican entre ambos también lo sean.[4]

Funciones

Las zonas stage pueden proporcionar beneficios diversos, pero la principal motivación para su uso es aumentar la eficiencia de los procesos ETL, garantizar la integridad de los datos y apoyar ciertas operaciones que aseguren la calidad de los mismos. Las funciones de un área de stage son las siguientes:

Consolidación de datos

Una de las principales funciones de un área de stage es la consolidación de datos de múltiples sistemas de origen.[2]​ Para ello el área de stage actúa como un gran "cubo" en el que los datos de varios sistemas de origen se ubican temporalmente para su posterior procesamiento. Adicionalmente, los datos del área de stage se suelen caracterizar con ciertos metadatos para identificar la fuente de origen, el momento (fecha/hora) en que los datos fueron cargados en esta zona u otra información que se considere relevante.

Alineación

La Alineación de datos consiste en la estandarización de estos a través de los múltiples sistemas de origen y la validación de las relaciones entre los registros y elementos de datos de diferentes fuentes.[2]​ Esta función está estrechamente relacionada con la administración de datos maestros,[5]​ ya que da soporte a este tipo de gestiones.

Minimizar la contención

Tanto el área de stage como los procesos ETL que apoya, a menudo se diseñan con el objetivo de minimizar la "discordia" en los sistemas de origen. A veces resulta más eficiente copiar los datos requeridos de un sistema de origen a la zona de stage de un golpe que tratar de recuperar únicamente registros individuales o pequeños conjuntos de registros.

El primer método, el área stage, se aprovecha de eficiencia técnica de las tecnologías de transmisión de datos, la reducción de los gastos generales a través de minimizar la necesidad de romper y volver a establecer las conexiones con los sistemas de origen y la optimización de la gestión de bloqueo de concurrencia en los sistemas de origen multi-usuario. Por su parte, los procesos ETL ejercen un alto grado de control sobre los problemas de concurrencia durante el procesamiento.

Planificación independiente de objetivos múltiples

El alojamiento de datos en un área de stage permite planificar de forma independiente, en cualquier momento, las operaciones de procesamiento de los mismos, pudiéndose realizar dichas operaciones cuando los diversos objetivos del negocio lo requieran.[2]​ En algunos casos, los datos se podrían llevar a la zona de stage en diferentes momentos, para luego procesarlos todos a la vez. Esta situación puede ocurrir, por ejemplo, cuando el normal desempeño de la empresa se realiza a través de múltiples zonas horarias. En otros casos, los datos se pueden cargar en el área de stage para ser procesados en diferentes momentos. El área de stage también se puede utilizar para enviar datos a múltiples sistemas de destino en diferentes momentos; por ejemplo, los datos operacionales diarios podrían ser enviados a un almacén operacional de datos (ODS), mientras que los mismos datos se podrían enviar mensualmente de forma agregada a un almacén de datos.

Detección de cambios

El área de stage permite realizar una detección de cambios eficaz frente a los sistemas de destino. Esta funcionalidad es particularmente útil cuando los sistemas de origen no soportan formas fiables de detección de cambios, tales como el sellado de tiempo (timestamping) impuesto por el sistema, el control de cambios (trazabilidad) o captura de datos modificados (CDC, change data capture).

La limpieza de datos consiste en la identificación y eliminación (o actualización) de datos no válidos de los sistemas de origen. El proceso ETL, utilizando el área de stage, se puede utilizar para implementar la lógica de negocio que permita identificar y manejar los datos "no válidos". Los datos no válidos se identifican a menudo mediante una combinación de reglas de negocio y ciertas limitaciones técnicas, las cuales, se pueden integrar en la estructura del área de stage (como por ejemplo, restricciones de tabla en una base de datos relacional) para hacer cumplir las reglas de validez de los datos.[2]

Cálculo de agregados

El pre-cálculo de valores agregados, otros tipos de cálculos y la aplicación de una lógica de negocio compleja puede hacerse en un área de stage para dar soporte a acuerdos de nivel de servicio altamente sensibles (o SLA, service-level agreement) o para la presentación de informes de resumen en los sistemas de destino.[3]

Archivo de datos y resolución de problemas

Un área de stage da soporte y permite realizar el archivo de datos. En este escenario esta zona se puede utilizar para mantener los registros históricos durante el proceso de carga, o se puede utilizar para enviar datos a una estructura de archivos de destino. Además los datos pueden conservarse durante largos periodos de tiempo para permitir resolver los problemas técnicos que puedan surgir en las operaciones ETL.[3]

Véase también

Referencias

  1. Oracle 9i Data Warehousing Guide, Data Warehousing Concepts, Oracle Corp.
  2. a b c d e Data Warehousing Fundamentals: A Comprehensive Guide for IT Professionals, p. 137-138, Paulraj Ponniah, 2001.
  3. a b c BI Experts: Big Data and Your Data Warehouse's Data Staging Area, The Data Warehousing Institute, Phillip Russom, 2012.
  4. Is Data Staging Relational? Archivado el 26 de diciembre de 2013 en Wayback Machine., Ralph Kimball, 1998.
  5. Master Data Management in Practice: Achieving True Customer MDM, Dalton Cervo and Mark Allen, 2011.

Enlaces externos

Read other articles:

La maja desnuda Kunstenaar Francisco Goya Jaar circa 1797–1800 Techniek Olieverf op linnen Afmetingen 97 × 190 cm Museum Museo del Prado Locatie Madrid RKD-gegevens Portaal    Kunst & Cultuur De beide maja's (vestida en desnuda) naast elkaar in het Museo del Prado La maja desnuda (De naakte maja) is een olieverfschilderij van de Spaanse kunstschilder Francisco Goya in het Museo del Prado in Madrid. Het schilderij geeft een naakte vrouw liggend achterover op een bed met k...

Jesús Comín Diputado en Cortes Generalespor Zaragoza 1933-1936 Información personalNombre en español Jesús Comín Sagüés Nacimiento 19 de abril de 1889 Zaragoza (España) Fallecimiento 4 de marzo de 1939 (49 años)Zaragoza (España) Causa de muerte Accidente de tránsito Nacionalidad EspañolaFamiliaHijos Alfonso Carlos Comín EducaciónEducado en Universidad de Zaragoza Información profesionalOcupación Abogado y políticoPartido político Comunión TradicionalistaMiembro de Cuerpo F...

Опис файлу Опис церква блаженного Миколая Чарнецького у Львові Джерело фото Р. Франківа Час створення 14.03.2020 р. Автор зображення Ю. Дубик Ліцензія див. нижче Ліцензування Цей твір поширюється на умовах ліцензії Creative Commons Attribution-Share Alike 3.0 Unported. Коротко: ви можете в...

Artikel ini tidak memiliki referensi atau sumber tepercaya sehingga isinya tidak bisa dipastikan. Tolong bantu perbaiki artikel ini dengan menambahkan referensi yang layak. Tulisan tanpa sumber dapat dipertanyakan dan dihapus sewaktu-waktu.Cari sumber: Vereniging van Spoor-en Tramwegpersoneel – berita · surat kabar · buku · cendekiawan · JSTOR VSTP atau Vereniging van Spoor-en Tramwegpersoneel adalah serikat buruh kereta api dan trem pertama, berdiri p...

Mooses Tooth The Moose’s Tooth, Moose’s Tooth Gipfel des Mooses Tooth Höhe 3139 m Lage Alaska, USA Gebirge Alaskakette Dominanz 13,76 km → Denali (Mount Kudlich) Schartenhöhe 1005 m ↓ (2134 m) Koordinaten 62° 58′ 9″ N, 150° 36′ 48″ W62.969212-150.6133573139Koordinaten: 62° 58′ 9″ N, 150° 36′ 48″ W Topo-Karte USGS Talkeetna D-2 Mooses Tooth (Alaska) Erstbesteigung 2. Juni 1964 dur...

Jõgeva Plaats in Estland Situering Provincie Jõgevamaa Gemeente Jõgeva Coördinaten 58° 45′ NB, 26° 24′ OL Algemeen Inwoners (2023) 5224 Foto's Bankgebouw uit 1939 Portaal    Baltische staten Jõgeva (Duits: Laisholm)[1] is een stad in de Estlandse provincie Jõgevamaa. Jõgeva is de hoofdstad van de provincie Jõgevamaa en van de gemeente Jõgeva (Estisch: Jõgeva vald). De stad heeft 5224 inwoners (2023).[2] Jõgeva was tot oktober 2017 een aparte ...

Scottish architect Claude Waterlow Ferrier FRIBA (1879 – 6 July 1935) was a Scottish architect, who specialised in the Art Deco style. Life Ferrier was the only son of the physician and neurologist Sir David Ferrier, and a nephew (through his mother) of the painter Ernest Albert Waterlow.[1][2] Educated at Marlborough College, Ferrier started his career as an apprentice at the practice of Aston Webb, but left to start his own practice at the age of just 23.[2] Ferrie...

Pour l’article ayant un titre homophone, voir Ernest Reynaud. Pour les articles homonymes, voir Raynaud. Ernest RaynaudErnest Raynaud vers 1890.BiographieNaissance 22 janvier 1864 ou 22 février 186410e arrondissement de ParisDécès 10 octobre 1936Nationalité françaiseActivité PoèteAutres informationsParti politique Action française‎‎Distinction Chevalier de la Légion d'honneur‎modifier - modifier le code - modifier Wikidata Ernest RaynaudPortrait par Frédéric-Auguste Cazals....

Pour les articles homonymes, voir Éditions Grasset, Bernard Grasset (homme politique) et Grasset. Bernard GrassetBiographieNaissance 6 mars 1881ChambéryDécès 20 octobre 1955 (à 74 ans)7e arrondissement de ParisSépulture Cimetière du Père-Lachaise, Grave of Grasset (d)Nationalité françaiseActivité éditeurParentèle Joseph Grasset (oncle)Autres informationsCondamnation Indignité nationaleTombe au cimetière du Père-Lachaise.modifier - modifier le code - modifier Wik...

سيدي الجوادي الإحداثيات 36°18′58″N 4°49′54″E / 36.316027777778°N 4.8317777777778°E / 36.316027777778; 4.8317777777778  تقسيم إداري  البلد الجزائر  التقسيم الأعلى قنزات  تعديل مصدري - تعديل   سيدي الجوادي معلومات البلد  الجزائر ولاية ولاية سطيف دائرة قنزات بلدية قنزات موقع 36°18′58″...

TSJ redirects here. For the Venezuelan court, see Supreme Tribunal of Justice (Venezuela). For the IATA code TSJ, see Tsushima Airport. La Mega Media, Inc.IndustryRadio Broadcasting and PublishingFounded1999 (originally as The Spanish Journal)HeadquartersColumbus, Ohio, USAKey peopleRoland Medrano (CEO)[1]ProductsLa Mega Nota, LaMega1, La Mega RadioRevenue$3 million (2019)[1]Number of employees24 (2019)[1]WebsiteOfficial Website La Mega Media, Inc., also known as La Me...

Pour les articles homonymes, voir 2e régiment. 2e régiment de chasseurs parachutistes Insigne de béret SAS en tissu Création 1943 Dissolution 1946 Pays France Branche Armée de Terre Type Infanterie parachutiste Rôle Infanterie Devise Qui ose gagne modifier  Le 2e régiment de chasseurs parachutistes est une des unités françaises les plus décorées de la Seconde Guerre mondiale. Elle est la seule unité non maritime à avoir obtenu la fourragère rouge au cours de ce co...

For the sports club, see Obras Sanitarias. Sanitary Works of the NationPalacio de Aguas Corrientes, OSN headquartersNative nameObras Sanitarias de la NaciónTypePublicIndustrySanitationFounded18 July 1912FounderRoque Sáenz PeñaDefunct15 December 1992; 30 years ago (1992-12-15) [1]FateDissolved, assets privatized in 1993 under the Carlos Menem administrationSuccessor Aguas Argentinas (1993–2006) AySA (2006–present) HeadquartersBuenos Aires, ArgentinaArea servedA...

Men's basketball team Virginia Tech Hokies 2023–24 Virginia Tech Hokies men's basketball team UniversityVirginia TechAll-time record1,518–1,256 (.547)Head coachMike Young (5th season)ConferenceAtlantic Coast ConferenceLocationBlacksburg, VirginiaArenaCassell Coliseum (Capacity: 10,052)NicknameHokiesStudent sectionCassell GuardColorsChicago maroon and burnt orange[1]   Uniforms Home Away Alternate NCAA tournament Elite Eight1967NCAA tournament Sweet Sixteen...

Painting by Francisco Goya The Bewitched ManSpanish: La lámpara del DiabloArtistFrancisco GoyaYearc. 1798MediumOil on canvasDimensions42.5 cm × 30.8 cm (16.7 in × 12.1 in)LocationNational Gallery, London The Bewitched Man (also known as The Devil's Lamp) is a painting completed c. 1798 by Francisco José de Goya y Lucientes.[1] It is an oil painting on canvas and depicts a scene from a play by Antonio de Zamora called The man bewitched by f...

Documentary film A Cop MovieFilm posterSpanishUna película de policías Directed byAlonso RuizpalaciosStarring Mónica Del Carmen Raúl Briones Release date March 2021 (2021-03) (Berlinale) CountryMexicoLanguageSpanish A Cop Movie (Spanish: Una película de policías) is a 2021 Mexican docudrama film directed by Alonso Ruizpalacios. The film stars Mónica Del Carmen and Raúl Briones.[1] The film had its worldwide premiere at the 71st Berlin International Film Festival ...

This biography of a living person needs additional citations for verification. Please help by adding reliable sources. Contentious material about living persons that is unsourced or poorly sourced must be removed immediately from the article and its talk page, especially if potentially libelous.Find sources: Remi Dada – news · newspapers · books · scholar · JSTOR (September 2018) (Learn how and when to remove this template message)Remi DadaBorn (1986-0...

Type of motorcycle MV Agusta 350BManufacturerMV AgustaAlso calledMV Agusta 350 BicilindricaProduction1970-1974SuccessorMV Agusta 350 IpotesiEngine349 cc (21 cu in) four-stroke parallel twin OHVBore / stroke63 mm × 56 mm (2.5 in × 2.2 in)Compression ratio9.2:1Top speed96 mph (154 km/h)Power27 hp (20 kW) @ 7600 rpmTransmissionWet, multi-plate clutch, unit construction 5-speed gearbox, chain driveSuspensionFront: Teledraulic...

Attic theatre performance related to both comedy and tragedy A drinking cup, c. 490–480 B.C., depicting a maenad and a satyr. The satyr play is a form of Attic theatre performance related to both comedy and tragedy. It preserves theatrical elements of dialogue, actors speaking verse, a chorus that dances and sings, masks and costumes. Its relationship to tragedy is strong; satyr plays were written by tragedians, and satyr plays were performed in the Dionysian festival following the performa...

YouTube Videoportal Sprachen Deutsch, 75 weitere Gründer Chad HurleySteve ChenJawed Karim Betreiber YouTube, LLCTochtergesellschaft der Google LLC Redaktion Neal Mohan (CEO) Registrierung Google-Konto (optional;zum Hochladen, Abonnieren, Kommentieren und Bewerten) Online seit 14. Feb. 2005 (aktualisiert 6. Feb. 2022) https://www.youtube.com/ YouTube (Aussprache [ˈjuːtuːb oder ˈjuːtjuːb]) ist ein 2005 gegründetes Videoportal des US-amerikanischen Unternehmens YouTube, LLC...