Big Data fra et teknisk perspektiv – Del 1
Begrebet ”Big Data” er efterhånden blevet temmelig omsiggribende og de muligheder, der nu gemmer sig under ”Big Data” paraplyen for virksomhederne er under konstant udvikling.
Begrebet ”Big Data” er efterhånden blevet temmelig omsiggribende og de muligheder, der nu gemmer sig under ”Big Data” paraplyen for virksomhederne er under konstant udvikling.
Vi støder med jævne mellemrum på opgaven at loade indholdet af en masse datafiler med betydende filnavne ind i Oracle.
Oracle databasen har indtil version 12c altid været svag, når det handlede om at returnere dele af en query’s resultat. Man kunne begrænse antallet af rækker, man fik retur, dog altid startende ved første række og med store problemer med sortering
Den næste version af Oracle databasen forventes at komme i år, muligvis endda før sommerferien. Men ellers er et godt bud, at den kommer i forbindelse med Oracle Open World 2013 i september. Jeg har skrevet “12c” i anførselstegn i overskriften, da ingen reelt ved om det er det den kommer til at hedde.
Hvornår giver indeksering af NULL værdier i Oracle databasen mening? Hvad kan man vinde ved det? Og hvordan gør man det i praksis? Disse spørgsmål forsøger jeg at besvare nedenfor.
Oracle 10g databasen er ikke længere et supporteret produkt hos Oracle, og man bør derfor altid vælge Oracle 11g, når man opsætter nye miljøer. Det samme gælder for kørende Oracle 10g installationer, hvor man bør planlægge en opgradering for at opnå et supporteret miljø.
En hyppig tilbagevendende problemstilling når man laver databaseudtræk til ”flade filer” i relationelle databaser som f.eks. Oracle, er at få 3- dimensionelle data til at blive 2-dimensionelle, så de passer ind i et filudtræk.
En af fordelene ved skyen er at man smidigt kan skalere sit brug efter behov, inklusiv helt at lukke sin løsning ned i perioder, og samtidig kun betale for det forbrug man har. Dette er dog ikke nødvendigvis helt problemfrit, hvilket jeg vil give et real-life eksempel på her.