Att flytta datalager är lite som att flytta in i ett nytt hus – båda sakerna medför ovisshet och kräver viktiga beslut. Eftersom det är en stor investering att flytta ett datalager är det viktigt att överväga olika alternativ och utvärdera om de kommer att uppfylla de strategiska mål man har.
I denna Tech Byte belyser Christian Foyer, Junior Data Engineer på Columna Flow Command Centre, fördelarna med att migrera från SQL Server till PostgreSQL och går igenom de utmaningar som kan uppstå under övergången och visar hur verktyg med öppen källkod på ett effektivt sätt kan användas för att uppfylla orkestreringsbehov.
Av Christian Foyer, Junior Data Engineer för Columna Flow Command Centre.
Kort och koncist om de viktigaste aktörerna: SQL Server jämfört med PostgreSQL
Microsofts SQL Server har varit en stark aktör inom relationsdatabashanteringssystem sedan 1989. Det är känt för sin förmåga att hantera strukturerade data på företagsnivå och integreras sömlöst med Microsoft-produkter. PostgreSQL, som skapades på University of California 1986, har istället årtionden av utveckling med öppen källkod bakom sig. Det är känt för sitt inbyggda stöd för olika datatyper, inklusive JSON, nyckel/värde-par och geometriska data, och utmärker sig genom att snabbt kunna behandla stora mängder data.
Jämförande analys: SQL Server kontra PostgreSQL
Nu ska vi titta närmare på några av de kritiska faktorer som kan göra det lättare för både företag och utvecklare att ta ett beslut.
- Kostnad
- SQL Server: 15 123 $ (företagslicens med 2 kärnor)*
- PostgreSQL: helt kostnadsfritt för all typ av användning, inklusive kommersiell
- Frågeplanering
- SQL Server: grafiskt gränssnitt med genomförbara förbättringar
- PostgreSQL: mer arbete krävs för ökad snabbhet, högre grad av förståelse krävs
- Datatyper
- SQL Server: fokus på strukturerad data, stöd för andra typer av efterkonvertering
- PostgreSQL: inbyggt stöd för ostrukturerade datatyper
- Integrering
- SQL Server: mycket bra integrering med Microsoft-verktyg, särskilt för analys
- PostgreSQL: stor mängd verktyg från tredje part med kompatibla anslutningar
- Utbildningsresurser
- SQL Server: plattformen Microsoft Learn
- PostgreSQL: stor gemenskap för öppen källkod som löpande skapar nytt utbildningsmaterial
- Säkerhetsfunktioner
- SQL Server: inbyggd övervakning, datamaskering och andra säkerhetsfunktioner
- PostgreSQL: avancerade säkerhetstillägg med stöd för olika autentiseringsmetoder och datakryptering
*Prissättning för SQL Server 2022 | Microsoft
"Genom att fokusera på meningsfulla insikter för optimering av sjukhusarbetsflöden kan vi enklare skala upp våra infrastrukturbehov när vi använder PostgreSQL som vårt datalager."
Datainhämtning och dataomvandling
Databashanteringssystemet är bara en del av datalagringspusslet. En övergång från SQL Server till PostgreSQL innebär att man behöver klara av utmaningen med att flytta från SSIS, SSAS och SSRS för datainhämtning och dataomvandling. T-SQL-lagrade procedurer kan konverteras, men arbete krävs för att replikera funktioner som är unika för T-SQL. Den bästa metoden är att använda verktyg som dbt för omvandling med select-satser.
Apache Airflow är ett måste när man ska orkestrera uppgifter och hantera pipelinen. Det intuitiva webbgränssnittet, det faktum att principen ”arbetsflöden som kod” följs och den öppna källkoden underlättar anpassningen jämfört med andra verktyg.
Använda PostgreSQL för analys av hälsovårdsdata
På Systematic används Command Centre som en dataanalysprodukt som inhämtar data från olika hälso- och sjukvårdsprodukter inom Columna Flow-sviten. Med fokus på värdefulla insikter för optimering av sjukhus arbetsflöden kan vi lättare skala upp våra infrastrukturbehov när vi använder PostgreSQL som vårt datalager. Tack vare stödet för icke-relationella data kan vi dessutom inhämta de olika JSON-data vi behöver och samtidigt bibehålla utmärkta prestanda.
Utvecklarperspektiv
Sammanfattningsvis erbjuder övergången från SQL Server till PostgreSQL ett strategiskt skifte med utmaningar och möjligheter som kan liknas vid de som finns när man flyttar till ett nytt hus. PostgreSQL utmärker sig genom sin långa historia av öppen källkod, sin kostnadseffektivitet och anpassningsförmåga till olika datatyper, vilket står i kontrast till SQL Servers integrering med Microsoft-produkter.
På Systematics Command Center har anammandet av PostgreSQL möjliggjort värdefulla insikter för arbetsflödesoptimering inom sjuk- och hälsovården, och eftersom våra arbetsflödeslösningar fokuserar på att hjälpa de som fattar viktiga beslut på en lägre nivå gör teknik med öppen källkod att fler personer får tillgång till dessa viktiga insikter.
Om författaren
Christian Foyer är Data Engineer på Systematic och arbetar på Columna Flow Command Centre. Han påbörjade nyligen sin yrkeskarriär och har varit hos oss på Systematic först sedan 2023 men har i sin roll hållit föredrag för lokala tekniska aktörer om programvarors roll när det gäller att optimera arbetsflöden inom sjuk- och hälsovården och använda dataavtal för att förbättra det interna samarbetet. Han vill dessutom ge tillbaka till gemenskapen för öppen källkod genom att göra insatser för olika datateknikverktyg.