Intelligenza Artificiale & Automazione

    LongCat-Video: AI open-source per fare video lunghi

    LongCat è un nuovo modello AI open-source che promette di produrre video più lunghi, mantenendo la coerenza dei personaggi e delle scene. Non stiamo parlando di un film ma di clip che iniziano, si sviluppano e arrivano da qualche parte. E' rilasciato con licenza MIT, quindi è utilizzabile da tutti. 

    i dati tecnici

     

    ChatGPT nelle app di incontri: tecnologia o inganno?

    Sempre più persone utilizzano modelli come ChatGPT per scrivere messaggi nei servizi di dating, un fenomeno che The Guardian ha definito “chatfishing”. È solo un aiuto per comunicare meglio o una nuova forma di inganno? Un tema su cui vale la pena riflettere.

    esempio di chatfishing

    I Large Language Model ragionano davvero?

    Negli ultimi giorni ha fatto discutere un paper di Apple intitolato “The Illusion of Reasoning”. Secondo i suoi autori, i modelli linguistici di grandi dimensioni (LLM) non ragionano veramente, ma si limitano a riconoscere schemi già visti. Altri studiosi hanno però criticato il paper, sostenendo che la metodologia usata non rappresenta in modo corretto le capacità attuali dei modelli.

    Audio Overviews di Google si espande: ora disponibile in italiano e in oltre 50 lingue

    Google ha ampliato le funzionalità di NotebookLM, rendendo la funzione Audio Overviews accessibile anche in italiano. Questo aggiornamento consente di ascoltare riassunti vocali dei propri documenti tramite voci AI, trasformando l’esperienza di apprendimento in un podcast interattivo. L’inclusione di oltre 50 lingue rende lo strumento più inclusivo e utile per studenti, professionisti e chiunque voglia apprendere in modo dinamico.

    Prompt Engineering: l'arte di guidare l'Intelligenza Artificiale

    Imparare a comunicare in modo efficace con l'AI è la chiave per ottenere risultati sorprendenti. Scopri cos'è il prompt engineering e perché sta diventando una competenza indispensabile per il futuro. In questa breve introduzione vedremo in cosa consiste e quali sono le principali tecniche che si possono usare.

    O3 e O4 Mini: i nuovi modelli di ragionamento avanzato di OpenAI

    OpenAI lancia O3 e O4 Mini, modelli agentici capaci di ragionare, usare tool esterni e comprendere immagini. Prestazioni da stato dell’arte, costi ridotti e nuove funzionalità come Codex CLI che cambiano il modo di interagire con l’AI. Vediamo cosa cambia, cosa possono fare e come trasformano lo sviluppo e l’analisi multimodale.

    esempio

    NotebookLM introduce le mappe mentali interattive

    NotebookLM ha rilasciato una nuova funzionalità gratuita di NotebookLM che trasforma automaticamente centinaia di pagine in mappe concettuali dinamiche. Le mappe sono navigabili, ogni nodo è cliccabile, rendendo possibile un apprendimento visuale delle informazioni in modo intuitivo e immediato. Una rivoluzione per studenti, ricercatori e professionisti della conoscenza.

    example

    OpenAI rilascia un nuovo modello per la generazione delle immagini

    Si trova dentro Sora il nuovo modello di OpenAI che genera immagini e video perfettamente aderenti al testo, partendo da semplici prompt o schizzi disegnati a mano. Un notevole balzo in avanti sia nella qualità delle immagini che nella coerenza dei testi rispetto a Dall-E, indispensabile per non essere superati dalla concorrenza sempre più frenetica nel settore AI.

    esempio

    Trasformare le foto in disegni a matita con l’AI di Google

    Scopri come convertire qualsiasi immagine in un disegno a matita utilizzando il nuovo modello di AI Google Studio, l’intelligenza artificiale del motore di ricerca di Mountain View. Una guida semplice e chiara, con esempi concreti, per ottenere schizzi puliti e professionali in pochi secondi.

    esempio

    R1-Omni: L’intelligenza artificiale che comprende le emozioni umane

    Il Tongyi Lab di Alibaba ha sviluppato R1-Omni, un innovativo modello di intelligenza artificiale capace di riconoscere e interpretare le emozioni umane attraverso l’analisi simultanea di voce, espressioni facciali e linguaggio del corpo. Grazie all’integrazione di un sistema di apprendimento avanzato, R1-Omni non solo identifica le emozioni, ma ne comprende il contesto, migliorando l’interazione uomo-macchina in settori come assistenza clienti, istruzione e intrattenimento. Scopri come questa tecnologia sta rivoluzionando il modo in cui l’IA interagisce con il mondo reale.

    QVQ-32B: Il modello LLM open source che sfida i giganti

    L’intelligenza artificiale sta attraversando una fase di rapida trasformazione, dove l’ottimizzazione dei modelli diventa più importante della loro grandezza e della dimensione degli LLM. Lo dimostra il recente rilascio di QVQ-32B, sviluppato da Qwen (Alibaba), un modello cinese open source da 32 miliardi di parametri in grado di competere con uno da 671 miliardi, grazie a tecniche avanzate di Reinforcement Learning.

    l'interfaccia di Qwen Chat

    OpenAI lancia Deep Research

    OpenAI ha presentato Deep Research, una nuova funzionalità avanzata su ChatGPT per condurre ricerche approfondite sul web, analizzando e sintetizzando informazioni con un elevato livello di autonomia. A differenza dei modelli tradizionali, questa IA impiega fino a 30 minuti per generare report dettagliati, corredati da citazioni precise e analisi strutturate. Una funzionalità che potrebbe di rivoluzionare l’accesso e l’elaborazione delle informazioni online.

    DeepSeek: un nuovo LLM made in China

    Nel vasto panorama degli LLM si aggiunge DeepSeek, un assistente virtuale sviluppato dalla società cinese DeepSeek. Il modello linguistico può rispondere in varie lingue, incluso l'italiano, e fornisce diverse funzionalità simili agli altri LLM. Ad esempio, può fare ricerche online tramite la funzione "search" e una funzione avanzata "DeepThink" progettata per analizzare problemi complessi e fornire soluzioni approfondite. Si può accedere gratuitamente al modello.

    esempio DeepSeek

    Come funziona ChatGPT O1

    L'evoluzione dei modelli di intelligenza artificiale come ChatGPT O1 passa attraverso un approccio innovativo: le catene di pensiero (Chain of Thought). Questa metodologia consente ai modelli di suddividere problemi complessi in passi logici, migliorando accuratezza e trasparenza nelle risposte. Grazie a tecniche avanzate come il verifier, che valuta e premia i ragionamenti più efficaci durante l'addestramento, l'IA si avvicina sempre di più a simulare capacità di ragionamento umano.

    System Prompt: la base nascosta degli LLM

    I system prompt sono le istruzioni fondamentali che guidano il comportamento delle intelligenze artificiali, stabilendo regole etiche e funzionali per garantire risposte coerenti e sicure. Questi meccanismi, simili a una "Costituzione" per l'IA, influenzano direttamente l'esperienza dell’utente e sollevano importanti questioni etiche legate a trasparenza, bias e adattamento culturale. In questa guida scopriamo come funzionano e quali implicazioni hanno per l’uso delle tecnologie AI nella nostra società.

    5 Framework per scrivere prompt efficaci su ChatGPT

    Questa guida presenta una serie di framework progettati per ottimizzare l'uso di ChatGPT e in generale su tutti gli LLM (Gemini, Claude, ecc.) utilizzando delle strutture chiare e mirate per la formulazione dei prompt. Sono strumenti utili per migliorare l'efficacia delle tue richieste, ottenere risposte più precise e pertinenti, in linea con i tuoi obiettivi specifici.

    Prompt e contesto: la chiave per un'interazione efficace con l'intelligenza artificiale

    La qualità delle risposte fornite dai modelli di intelligenza artificiale dipende in larga misura da due elementi fondamentali: il prompt e il contesto. Questo articolo esplora come una formulazione chiara e dettagliata delle richieste, insieme alla capacità di fornire il giusto contesto, possa migliorare significativamente l'interazione con l'IA.

    Cos'è il Chain of Thougth e come funziona?

    Il Chain-of-Thought (CoT) è una tecnica di prompting che consente ai modelli di intelligenza artificiale di suddividere il processo di risoluzione dei problemi in una serie di passaggi intermedi. Invece di fornire risposte immediate, il modello spiega il proprio ragionamento, aiutando a comprendere il percorso logico che porta alla soluzione finale. Questo articolo esplora come funziona il CoT e come può essere utilizzato per migliorare l'accuratezza e la trasparenza nei sistemi di IA.

    Chain of Thougth (prompting)

    OpenAI rilascia ChatGPT-4o (Omni)

    OpenAI ha lanciato ChatGPT-4o (Omni) introducendo innovazioni significative nell'interazione con l'intelligenza artificiale. Le nuove funzionalità includono risposte in tempo reale, comprensione delle emozioni e traduzione vocale multilingue in tempo reale. Questo articolo esplora come queste caratteristiche migliorano l'esperienza utente e ampliano le applicazioni pratiche dell'IA.

    esempio di assistente vocale

    Come accedere direttamente su Gemini tramite Google Chrome

    Recentemente, Google ha lanciato una novità sul browser Chrome che permette agli utenti di accedere e interagire con Gemini direttamente tramite la barra di ricerca, ottimizzando significativamente il processo di ricerca e di ottenimento delle risposte. Scopriamo insieme come sfruttarla al meglio.

    come accedere a Gemini da Google Chrome

    La nuova funzione "Dynamic" di ChatGPT4

    OpenAI ha recentemente lanciato una nuova funzionalità per il suo modello ChatGPT, chiamata "Dynamic". Questa innovazione è progettata per ottimizzare le interazioni con l'intelligenza artificiale, migliorando notevolmente sia la rapidità che la precisione delle risposte.

    la versione dinamica di ChatGPT4

    ChatGPT introduce un nuovo pulsante per le citazioni

    Di recente ChatGPT ha introdotto una nuova funzionalità "quote" che permette agli utenti di selezionare una parte di una conversazione per citarla nelle domande successive. Appare con il simbolo delle virgolette dopo aver selezionato un testo. È particolarmente utile per chiedere un approfondimento senza dover copiare o riscrivere il testo ogni volta e permette di ottenere risposte più precise. Vediamo come funziona.

    il simbolo delle citazioni

    Creare musica tramite l'AI di Suno

    Oggi esploriamo Suno, una rivoluzionaria piattaforma di creazione musicale basata sull'intelligenza artificiale. Questo strumento permette agli utenti di generare automaticamente brani musicali personalizzati utilizzando solo l'AI, trasformando radicalmente il modo in cui la musica può essere creata e personalizzata.

    l'interfaccia di suno

     

    La nuova funzionalità per modificare le immagini con ChatGPT4

    Ora ChatGPT4 permette di modificare singole parti di una immagine generata, senza modificare il resto dell'immagine. Si possono specificare cambiamenti relativi a colori, elementi da aggiungere o rimuovere, modifiche allo sfondo, o qualsiasi altro dettaglio.

    seleziona l'area da modificare

    La tecnica dello snapshot sheet per creare una persona virtuale

    Negli ultimi mesi sta spopolando il fenomeno degli influencer virtuali. Sono foto realistiche generate dalla AI di persone virtuali che, a volte, hanno un livello di realismo impressionante. Per generali basta usare un software di intelligenza artificiale generativa. Senza fare nomi ce ne sono tanti. In questo tutorial vediamo come usare la tecnica dello snapshot sheet.

    un esempio di snapshot sheet

    Come simulare un'interrogazione di scuola o un esame universitario su ChatGPT

    Simulare un'interrogazione con ChatGPT può essere un metodo efficace per prepararsi a esami o test. In questo scenario, ChatGPT assume il ruolo del professore e pone le domande, una dopo l'altra, mentre l'utente risponde. In questo tutorial ti spiego come fare.

    la simulazione di una interrogazione

    Come ottimizzare un prompt su ChatGPT

    Alcuni consigli pratici basati sulla prompt engineering per ottenere risultati migliori su ChatGPT. Una guida rapida alle Best Practices per scrivere un post efficace e massimizzare la precisione delle risposte.

    Come scrivere un prompt

    I toni per scrivere un prompt efficace su ChatGPT

    Alcune strategie e tecnìche utili per scrivere dei prompt più efficaci sugli LLM come ChatGPT, Bard e Claude, usando la prompting tones. Un elenco di termini che rafforzano e impostano la comunicazione verso un determinato obiettivo e aiutano a ottenere delle risposte più vicine alle proprie aspettative.

    Toni per scrivere un prompt

    Il seed delle immagini e la coerenza dei caratteri

    La coerenza dei caratteri nella creazione delle immagini in ChatGPT e DALL-E passa per il seed (o seme). È un numero casuale utilizzato per inizializzare una immagine ed è molto utile se non si vuole modificare lo stile e i personaggi presenti nell'immagine.

    un esempio di altra foto generata dallo stesso seme

    La creazione di un'immagine con lo stesso personaggio

    Quando creiamo delle foto tramite la AI è spesso molto difficile riutilizzare la stessa persona per generare altre foto. In questo tutorial esploriamo come riuscire a generare più immagini usando lo stesso personaggio tramite la funzione copy seed di Leonardo AI.

    la copia del numero di seed

    Come trasformare un disegno in una immagine tramite la AI

    In questa guida vediamo come utilizzare uno strumento di Leonardo AI per trasformare lo schizzo di un disegno in una foto o un dipinto ricco di dettagli. Si tratta della nuova funzionalità Live Canvas ed è particolarmente utile.

    il risultato finale

     

    Perplexity.ai: il nuovo orizzonte della ricerca online

    In un mondo digitale in rapida evoluzione trainato dall'intelligenza artificiale, emerge Perplexity.ai, una piattaforma che si profila come una via di mezzo tra un motore di ricerca e un'assistente AI a metà strada tra Google e ChatGPT. Vediamo come funziona.

    la home page di perplexity

     

    Come creare una immagine su ChatGPT a partire da una esistente

    Nel tutorial scoprirai come trasformare un'immagine esistente in una nuova creazione visiva utilizzando le capacità di ChatGPT con DALL·E. Passo dopo passo, sono illustrati i semplici passaggi per caricare un'immagine, descriverla e generare una versione modificata o ispirata, tutto direttamente all'interno dell'interfaccia di ChatGPT.

    come creare una immagine su ChatGPT

    Come modificare una foto su CHATGPT usando il gen_id

    In questa guida, ti mostrerò come sfruttare al meglio il gen_id per migliorare e personalizzare le immagini generate su ChatGPT4. Il gen_id è un identificativo unico assegnato ad ogni immagine creata, che ti permette di fare riferimento specifico a quell'immagine in richieste successive, garantendo così modifiche più precise e risultati ottimali.

    ecco un esempio di foto ritoccata

     

    L'intelligenza artificiale

    intelligenza artificialeL'intelligenza artificiale (Artificial Intelligence o AI) è un settore dell'informatica che progetta e realizza macchine in grado di apprendere la conoscenza e decidere in modo autonomo dall'uomo.

     

    Il machine learning

    Il machine learning è il settore dell'intelligenza artificiale che si occupa degli algoritmi di apprendimento e addestramento di una macchina. Esistono diverse tecniche e approcci: supervisionato, non supervisionato, per rinforzo, deep learning, ecc.

    • Machine learning supervisionato
      Questa tipologia di ML è caratterizzata da algoritmi che imparano da una sequenza di esempi forniti dall'uomo (dataset di training).
    • Machine learning non supervisionato
      Sono algoritmi in grado di costruire un modello a partire da una grande quantità di dati senza alcun aiuto da parte dell'uomo.
    • Reinforcement Learning
      Questo approccio al ML è basato sull'apprendimento per tentativi ed errori tramite l'esperienza passata rispetto al raggiungimento di un obiettivo specifico. Le scelte sbagliate sono penalizzate mentre quelle corrette sono premiate (rinforzo). Non c'è un dataset di training. La macchina impara dall'esperienza.

     

     

     
     
    FacebookTwitterLinkedinLinkedin