MusicGen propose la création de musiques à partir d'un texte. Mais il se distingue par une capacité innovante, et plus que prometteuse.


au sommaire


    En matièrematière de génération de musique par intelligence artificielle, nous avons eu droit, pour l'heure, à trois approches principales :

    • les applications telles que Soundraw vous demandent de  choisir une atmosphèreatmosphère, un genre musical, un tempo... À partir de là, un morceau est généré ;
    • fort original, SingSong de Google nous demande de fredonner un morceau et il crée alors un accompagnement ;
    • GoogleGoogle MusicLM, Mubert ou Riffusion nous demandent de taper un « prompt » décrivant la musique et génèrent alors celle-ci. MusicLM a paru assez avancé en la matière, mais nous n'avons pas encore pu le tester à ce jour.

    C'est la 3e approche qu'a choisie Meta/FacebookFacebook avec son MusicGen. Que dire ? Il se sort honorablement de l'opération. Meta affirme que le point distinctif serait l'usage d'un modèle de génération simplifié qui a été entraîné sur 20 000 de musique « autorisée », et d'une base de données de 10 000 enregistrements audio de qualité.

    Nous avons soumis MusicGen à divers prompts (requêtes), y compris en lui demandant de générer un morceau « à la française ». Vous pouvez découvrir les résultats dans la vidéo ci-dessous. Comme vous pourrez le constater, il faut parfois se montrer un peu détaillé dans sa requête pour obtenir le résultat souhaité.

    Test de MusicGen, l'application « text to music » de Meta. © Meta

    À la manière de…

    Toutefois, ce qui distingue MusicGen, c'est qu'il est possible de partir d'un enregistrement existant. Un peu comme lorsque, dans MidJourney, vous générez une illustration à partir d'une image que vous lui soumettez. Là encore, la vidéo vous propose deux exemples de morceaux habilement dérivés de Bach. À terme, rien ne vous empêcherait de charger « Balance ton quoi », « Roxanne » ou « Yesterday » et de générer des morceaux originaux à partir de ces bases. Il faudra toutefois vérifier qu'aucune atteinte aux droits d'auteur n'est patente.

    Sur Hugging Face

    Si vous souhaitez juste tester la bête sans trop vous soucier de code PythonPython, vous pouvez accéder à cette démo sur Hugging Face. Le souci, c'est qu'elle est terriblement lente et qu'il faut se préparer à attendre des dizaines de minutes pour générer un simple morceau - lorsque l'applicationapplication ne vous dit pas, purement et simplement, qu'elle est saturée de demandes et qu'il faudra réessayer plus tard.

    La démo de MusicGen sur Hugging Face est souvent saturée de demandes. © Hugging Face
    La démo de MusicGen sur Hugging Face est souvent saturée de demandes. © Hugging Face

    Depuis Google Colab

    L'alternative, a priori intimidante consiste à passer par l'interface Google Colab. Pas d'inquiétude, le code Python est prédéfini et il vous suffit de cliquer sur les flèches situées à gauche de chaque bloc de code, afin de l'exécuter. Lorsque vous parvenez au dernier bloc de code, vous pouvez remplacer les prompts par des requêtes de votre choix.

    Nous avons ici testé MusicGen sur cinq morceaux dont un « à la française ». © Musicgen, Google Colab
    Nous avons ici testé MusicGen sur cinq morceaux dont un « à la française ». © Musicgen, Google Colab