Glossario

Consulta il nostro glossario sulla gestione dati per passare in rassegna i termini e le definizioni in uso in Acterys e Microsoft Fabric

Le Parole di Acterys

Acterys è una piattaforma di pianificazione e analisi estesa (xP&A) che integra strumenti familiari quali Power BI/Excel, in grado di aiutare ad estrarre più velocemente e facilmente valore dai dati aziendali, anche con il supporto di tecnologie AI.

Disponibile sia on premise che in cloud, Acterys oggi è al servizio di oltre 700 aziende di successo in tutto il mondo e Bi Factory ne è partner per l’Italia, curando l’implementazione in soluzioni di EPM (Enterprise Performance Management) efficienti e personalizzate.

[Per saperne di più su Acterys, visita la pagina dedicata]

EPM

Acronimo di Enterprise Performance Management – Gestione delle prestazioni aziendali – è un sistema che aiuta le persone impegnate in azienda a comprenderne l’andamento e a pianificarne lo sviluppo.

Spesso questo sistema è affiancato a sistemi ERP (Enterprise Resource Planning, pianificazione delle risorse aziendali), tipicamente focalizzati sull’aspetto gestionale.

Le soluzioni EPM nascono per rafforzare la capacità dell’azienda di “guardare avanti” in maniera sistematica, ragionando anche su scenari possibili (“what if”, letteralmente “cosa se”) in modo da poter anticipare i vari cambiamenti, possibilmente anche quelli imprevisti.

Per migliorare l’utilità di questi sistemi è fondamentale che siano basati su dati il più possibile completi, aggiornati e veritieri ed è per questo motivo che i sistemi EPM più evoluti, come le soluzioni basate su Acterys, permettono la connessione ad un importante numero di basi dati, anche legacy, consentendo di portare in uno o più cruscotti (dashboard) sintetici dati con le provenienze più disparate.

FP&A

La pianificazione e l’analisi finanziaria (in inglese Financial planning & Analytics) è un processo utilizzato dagli analisti per sviluppare strategie basate sui dati per guidare la salute finanziaria di un’azienda. Sfruttando gli approfondimenti basati sui dati, chi si occupa di FP&A assicura che tutte le strategie siano allineate con i risultati previsti nelle loro previsioni. Questo approccio è fondamentale per facilitare i progressi dell’azienda e migliorarne la crescita complessiva.

xP&A

Acronimo di eXtended Planning & Analysis (Pianificazione e analisi estesa), un’espressione che indica l’estensione dei processi FP&A – Financial Planning & Analysis, cioè pianificazione e analisi finanziaria – a tutti i dipartimenti aziendali, in maniera per l’appunto “estesa”. I benefici di questo approccio sono molteplici e sono sempre più le aziende che lo adottano, ottenendo un unico piano esteso in grado di permettere alle persone impegnate nei diversi dipartimenti di collaborare al meglio.

Le Parole di Microsoft Fabric

Microsoft Fabric è la piattaforma SaaS unificata di riferimento proposta da Microsoft per la gestione a 360° di dati e analytics. Un’unica base dati multi-cloud (OneLake) è accessibile in piena sicurezza in tempo reale senza duplicati, per consentire a persone e gruppi di lavoro di collaborare meglio e compiere analisi e scelte migliori assistite dall’intelligenza artificiale. Con Microsoft Fabric ottieni di più dai tuoi dati e migliori la tua competitività. [Per saperne di più su Microsoft Fabric, visita la pagina dedicata]

AIskill

AI Skill sono lo strumento con cui, nel contesto di Microsoft Fabric, si può ottenere questo risultato: liberare gli analisti dalle domande più “facili” assicurandosi al contempo che le risposte fornite in automatico siano il più possibile adeguate per gli scopi specifici delle diverse persone.

Gli AI Skill sono disegnati per permettere di focalizzarsi sui dati, stabilendo con precisione a quali l’AI deve poter avere accesso, sono configurabili con istruzioni semplici ed esempi pratici anche da personale non tecnico, sono intrinsecamente sicuri, con un controllo rigoroso sulle query che possono eseguire.

Insieme a Copilot, gli AI Skill rendono Microsoft Fabric una piattaforma moderna e flessibile, in cui trasformare le promesse dell’AI in risultati per l’azienda diventa non solo possibile, ma anche facile ed accessibile.

Apache Parquet

è un formato di archiviazione dati colonnare gratuito e open-source che fa parte dell’ecosistema Apache Hadoop ed è stato adottato anche da Microsoft nel contesto della piattaforma Microsoft Fabric e in Azure Databricks. Si tratta di un formato particolarmente efficiente su più fronti: permette livelli di compressione e velocità di lettura di dati specifici inarrivabili con altri formati, rivelandosi ideale quando si tratta di gestire grandi quantità di dati (big data).

AutoML

AutoML è una raccolta di metodi e strumenti che può semplificare notevolmente il processo di estrazione di valore dai dati tramite questa tecnica, con soluzioni capaci di aiutare anche chi ha poca confidenza ad arrivare in tempi brevi e con costi ottimizzati a dei risultati soddisfacenti.

Durante l’attività di training AutoML mette alla prova – anche in parallelo – algoritmi e iperparametri per trovare e suggerire le combinazioni ideali con cui continuare.

L’attività di ottimizzazione del processo è particolarmente importante: l’apprendimento automatico può portare a risultati di grandissimo rilievo, ma ha anche dei costi che possono diventare importanti, ed è quindi fondamentale mettersi nelle condizioni di fare sin da subito scelte ottimali.

Dalla preparazione dei dati al supporto per l’interpretazione del processo e dei risultati, AutoML rende più facile l’accesso alla creazione di valore tramite machine learning.

Data Factory

Data Factory è, per usare le parole di Microsoft stessa, il servizio di “estrazione, trasformazione e caricamento (ETL, extraction, transformation, loading) e integrazione di dati basato sul cloud che consente di creare flussi di lavoro basati sui dati per orchestrare lo spostamento e la trasformazione dei dati stessi su larga scala”.

Si tratta di uno strumento molto potente e flessibile, in grado di copiare a velocità elevatissime i nostri dati dentro i Lakehouse per permetterne l’analisi.

Inoltre, grazie ad un’interfaccia che non richiede competenze di programmazione, permette di creare flussi di dati (“dataflows”) complessi, con trasformazioni concatenate e molti altri strumenti in grado di rendere rendere i dati utili e pronti anche per le analisi più sfidanti.

Per chi poi deve muovere grandissime quantità di dati, nell’ordine dei Petabyte, ci sono le Data Pipelines, vere e proprie “conduttore” strutturate per agevolare e gestire al meglio flussi dati così consistenti.

Data Factory si innesta nell’ecosistema di Microsoft Fabric come uno strumento su cui contare per accelerare in sicurezza l’ingestione, la trasformazione ed il caricamento di dati.

Eventhouse

Una Eventhouse (letteralmente “casa degli eventi”) è uno spazio di lavoro dinamico che può contenere al suo interno molteplici database KQL e altri flussi dati, condivisibili nel contesto di un medesimo progetto. Telemetrie, log di sicurezza, transazioni finanziarie, dati IoT: grazie a questi spazi di lavoro si possono gestire in maniera scalabile situazioni complesse per arrivare ad analisi in tempo reale su cui fare affidamento, con un occhio di riguardo anche sul fronte dei costi, grazie ad una gestione ottimizzata che permette di sospendere i servizi quando non in uso, pur assicurando una latenza davvero minima nel caso di riattivazione. Comprendere e mettere a terra il potenziale di questa risorsa può contribuire in maniera determinante al successo di un progetto: se devi gestire e analizzare dati in tempo reale, scopriamo insieme il potenziale di Microsoft Fabric per il successo della tua impresa, contattaci per una consulenza gratuita!

Fabric Notebook

In Microsoft Fabric i notebook sono ambienti interattivi e collaborativi in cui è possibile scrivere ed eseguire codice con molteplici linguaggi di programmazione per analizzare dati, creare modelli e visualizzare risultati in un unico contesto accessibile da più persone (data scientist, analisti, sviluppatori, etc.).

In un notebook si può lavorare con Python, Apache Spark, SQL, R… c’è davvero l’imbarazzo della scelta: ogni cella può contenere codice e descrizioni in Markdown, tabelle e anche grafici.

Tutto questo resta salvato e condiviso in un unico file: dal machine learning alla reportistica avanzata, i notebook di Microsoft Fabric rendono davvero facile accedere ai dati e collaborare, avvalendosi di strumenti e linguaggi familiari.

KQL

KQL indica il “Kusto Query Language”, cioè il linguaggio di interrogazione Kusto, nato per facilitare il recupero di informazioni da insiemi di dati strutturati, semistrutturati e non strutturati. Questo linguaggio è facile da ricordare e interpretare, ma la sua natura amichevole non deve far sottovalutare la sua potenza, perché permette di generare interrogazioni complesse, facendo emergere rapidamente dai dati informazioni di rilievo. Nel contesto di Microsoft Fabric è una risorsa di grande valore, soprattutto nell’interrogazione di database di grande entità e/o con dati in tempo reale. Le espressioni da esploratori di fondali che stiamo usando non sono a caso: quel Kusto che troviamo nel nome è proprio un omaggio al grande e compianto Jacques Cousteau (11 giugno 1910 – 25 giugno 1997), un vero e proprio pioniere dell’esplorazione sottomarina che è stato tra i primissimi a regalarci immagini e racconti delle meraviglie che si trovano nelle profondità marine. Proprio come novelli Cousteau Microsoft ci invita a tirare fuori il meglio dai nostri dati, trasformandoli prima in informazioni, poi sapere e infine azione.

Lakehouse

Tecnicamente una Lakehouse è una “raccolta di file, cartelle e tabelle che rappresentano un database su un data lake usato dal motore Apache Spark e dal motore SQL per l’elaborazione di Big Data”.

Si tratta di una soluzione flessibile e scalabile che consente alle organizzazioni di gestire grandi volumi di dati usando vari strumenti e framework per elaborare e analizzare tali dati, anche in tempo reale.

In un’unica architettura si ritrovano le caratteristiche e funzionalità dei data lake e dei data warehouse, abilitando analisi evolute come quelle possibili anche grazie ad algoritmi di machine learning e altre risorse.

È una delle fondamenta dell’ecosistema di Microsoft Fabric e permette ai professionisti che si interfacciano con le soluzioni basate su questa piattaforma di raggiungere meglio e più rapidamente i propri obiettivi.

Per saperne di più su questo tema i nostri esperti sono a disposizione: visita il nostro sito per richiedere una consulenza!

Medallion Architecture

Nel gestire dati provenienti da più fonti ci si trova a lavorare con dati più o meno strutturati e più o meno adeguati all’impiego che ne va fatto. Proprio partendo da questa consapevolezza nel contesto del Lakehouse di Microsoft Fabric è in uso uno schema progettuale – la Medallion Architecture – che suggerisce di collocare i dati in tre livelli distinti: bronzo, argento e oro. Il livello più basso (bronzo) corrisponde ai dati grezzi, quelli non elaborati: quando poi gli stessi vengono convalidati (di fatto puliti e uniformati) possono passare nel livello argento. Infine, nel caso siano stati arricchiti, vengono posizionati nel livello oro, tipicamente destinati come sorgente dati per il modello semantico. Questa strategia organizzativa agevola il lavoro delle persone impegnate con i lakehouse di Microsoft Fabric.

OneLake

OneLake è un unico data lake per tutta l’organizzazione, in cui far confluire grandi quantitativi di dati strutturati e non, anche in tempo reale, da più fonti, grazie a centinaia di connettori integrati in Data Factory. Basato su Azure Data Lake Storage (ADLS), OneLake archivia tutti i dati in formato Delta Parquet (vi ricordate? Ne abbiamo parlato in una puntata precedente di questa rubrica) e permette:
  • organizzazione di Tenant e aree di lavoro, per una governance sempre chiara
  • gestione granulare di accessi e autorizzazioni
  • esplorazioni agevoli direttamente da Windows con OneLake File Explorer
  • collegamenti tra file evitando duplicazioni
  • disponibilità immediata per motori analitici multipli (T-SQL, Apache Spark, Analysis Services e altri)
  • accesso diretto ai dati con Power Bi grazie alla modalità Direct Lake

Real-Time Intelligence

La potenza della piattaforma di Data Analytics proposta da Microsoft si esprime anche nella sua capacità di gestire flussi dati in tempo reale, anche di grandi dimensioni (Gigabyte o addirittura Petabyte) per trasformarli in risorse subito analizzabili e/o per consentire reazioni tempestive all’avverarsi di certe condizioni.  

Dall’immissione dei dati alla loro trasformazione, dall’archiviazione al loro impiego tramite algoritmi di intelligenza artificiale: tutto può avvenire in tempo reale, garantendo il massimo controllo in tutte quelle situazioni in cui la tempestività è fondamentale, dalla gestione delle frodi ai processi produttivi, dalla gestione degli aspetti di sicurezza alle situazioni in cui sono attesi picchi di qualsiasi genere, come nel caso di giornate promozionali particolarmente popolari, come ad esempio il #blackfriday.  

L’esperienza della gestione dell’intelligenza in tempo reale in Microsoft Fabric parte dal “Real-Time hub”: flussi di dati, sorgenti Microsoft, eventi Fabric… tutto trova spazio in questo hub, che fa da vero e proprio punto di partenza per mettere a terra il potenziale della Real-Time Intelligence.  

Semantic Link

Semantic Link è una funzionalità esclusiva di Microsoft Fabric che collega i modelli semantici di Power BI con l’ambiente di Data Science di Synapse. Questo collegamento consente ai data scientist di accedere direttamente a dati raffinati e definizioni aziendali, semplificando l’integrazione tra analisi di business e processi di data science. Tra i principali vantaggi messi a disposizione da questa risorsa troviamo:
  •  La possibilità di accedere direttamente ai modelli semantici: i dati già definiti in Power BI possono essere utilizzati nei notebook e nei flussi di lavoro di data science, evitando duplicazioni di logica, con un significativo risparmio di tempo ed evitando possibili disallineamenti.
  • Disponibilità dei Metadati: informazioni come relazioni tra tabelle, categorie e gerarchie vengono preservate, migliorando coerenza e precisione.
  • Compatibilità con strumenti familiari: il supporto per librerie di uso comune come Python pandas e Apache Spark, permette agli operatori di muoversi con agilità in contesti già noti.
La funzionalità Semantic Link è quindi un vero e proprio ponte tra analisti e data scientist, capace di consentire collaborazioni migliori e, di riflesso, risultati migliori. Ancora una volta emerge il valore ecosistemico di Microsoft Fabric: ridurre la frizione ed evitare sprechi, per consentire di arrivare prima e meglio agli obiettivi di business.

Shortcut

Si tratta di veri e propri collegamenti simbolici all’interno di OneLake, che permettono l’accesso a dati di altre origini direttamente in OneLake, mantenendo un singolo punto di accesso.

Questa risorsa permette di evitare la duplicazione di dati, riducendo costi di archiviazione e trasferimento.

Una volta ripresi tramite una shortcut, i dati restano accessibili come se fossero nativi, permettendo agli utenti di utilizzarli al pari di tutti gli altri dati: la provenienza può essere di diverso tipo, da un bucket S3 di Amazon ad un Azure Data Lake Storage (ADLS) Gen2, fino anche ad altri Lakehouse, magari attivi in altre regioni.

La funzionalità Shortcut si preoccupa di tutte le operazioni necessarie per rendere disponibili i dati in questione e abilita un’esperienza d’uso decisamente più agevole in tutte quelle organizzazioni che, per qualsiasi motivo, si trovano a lavorare con architetture ibride e/o multi-cloud.

Tenant

Si tratta di un’istanza dedicata di servizi cloud Microsoft, che viene associata ad una specifica organizzazione. Ogni tenant è separato dagli altri e tutte le risorse (capacità, workspace, dataset, report, strumenti di analisi, etc.) restano nel contesto del singolo tenant.

Questa modalità consente di isolare e proteggere i dati, ma anche di consentire ad organizzazioni (ad esempio dipartimenti della medesima azienda) con esigenze radicalmente diverse tra loro di configurare la propria istanza nelle modalità più appropriate, anche sul fronte della gestione delle licenze e/o degli utenti.

Ogni tenant è legato a un dominio dns e ne può includere di aggiuntivi. Ad ogni tenant corrisponde un GUID univoco, noto come tenant id.

Tutto quello che avviene nel contesto di un tenant può essere esaminato con strumenti evoluti di monitoraggio, come audit log e report sull’impiego delle risorse, sia ai fini di ottimizzazione dell’allocazione delle stesse sia per motivi di sicurezza.

La possibilità di configurare più tenant in un’organizzazione può essere molto utile per assicurare che determinati dati restino in determinate regioni geografiche, assicurandone la sovranità e permettendo alle organizzazioni che li gestiscono di rispettare le norme locali.

È importante sottolineare che separazione non significa incomunicabilità: con le dovute attenzioni gli amministratori dei tenant possono configurarli per condividere report e dataset.

Vuoi ricevere
gli aggiornamenti
sui nostri servizi?

Iscriviti alla nostra Newsletter!