Comment connecter Claude Code à 3CX pour coder par téléphone sans infrastructure coûteuse

Un projet innovant permet désormais de contrôler Claude Code, l’interface de codage AI d’Anthropic, par téléphone. En combinant le protocole SIP, le serveur PBX 3CX gratuit et des outils de traitement vocal, la solution propose une passerelle voix vers code sans infrastructure lourde ni frais d’intégration. Ce développement marque une avancée importante dans l’accessibilité vocale aux IA de génération de code.

Une interface de code commandée par téléphone

Le dépôt claude-phone sur GitHub détaille un système fonctionnel reliant un appel téléphonique à Claude Code. Le projet exploite les capacités de 3CX, un PBX logiciel compatible SIP, pour connecter un appel entrant à un agent IA enregistré comme simple extension. À la différence d’une intégration SIP trunk traditionnelle, ce système contourne les limitations de la version gratuite de 3CX en enregistrant Claude Code comme un téléphone classique dans l’interface administration.

L’utilisateur compose un numéro, parle, puis le système transforme sa voix en texte via un serveur média. Ce texte est envoyé à Claude Code, qui comprend et exécute la commande. La réponse est ensuite reconvertie en voix et restituée à l’appelant. L’ensemble repose sur le protocole SIP pour transmettre la voix et les commandes, et sur Claude Code pour l’interprétation et l’exécution.

Architecture technique et composants clés

Le cœur fonctionnel de la solution repose sur une architecture en trois parties :

  • 3CX gère la signalisation d’appel SIP et assure le routage des appels entrants vers les extensions configurées.
  • Un serveur média traite l’audio en temps réel. Il utilise des outils comme Whisper.cpp pour la transcription et Kokoro-FastAPI pour l’interface d’interprétation vocale.
  • Claude Code reçoit les requêtes, exécute les instructions, puis retourne une réponse adaptée vocalement.

Pour éviter les restrictions du plan gratuit de 3CX, l’équipe du projet n’a pas utilisé de SIP trunk personnalisé, mais fait passer Claude Code pour une extension SIP enregistrée. Cette astuce évite près de 1 000 dollars de frais mensuels d’hébergement vocal avec des fournisseurs VoIP haut de gamme.

Configurer 3CX et SIP pour Claude Code

La configuration de la plateforme suit plusieurs étapes clés :

  1. Ajout d’un trunk ou d’une extension SIP : Claude Code est enregistré dans la console d’administration de 3CX comme un softphone ou terminal SIP standard.
  2. Définition des règles de routage : des préfixes permettent d’identifier rapidement une commande adressée à l’agent vocal AI.
  3. Test via softphone : les appels avec numéro préfixé atteignent directement l’interface AI.
  4. Transfert SIP (Refer) : pour passer l’appel d’un bot à un agent humain si nécessaire, un transfert SIP vers une autre extension s’effectue en un clic.

Des opérateurs comme Twilio ou Telnyx fournissent les numéros E.164 et les trunks sortants si l’on souhaite élargir la portée du système vers l’extérieur.

Outils complémentaires pour perfectionner la voix

Pour enrichir les interactions vocales, le système peut inclure VoiceMode MCP — un protocole open-source conçu pour les dialogues naturels. Son moteur de transcription Whisper.cpp fonctionne localement, ce qui améliore la confidentialité. Parmi les autres composants cités pour une intégration fluide figurent LiveKit pour le streaming audio temps réel, n8n pour la gestion des flux de données et Retell AI comme framework d’orchestration vocale complet.

Un bond vers la téléphonie intelligente sans pertes financières

L’un des grands avantages du projet se trouve dans son coût maîtrisé. À l’aide d’un serveur personnel léger, d’un numéro VoIP abordable et des versions gratuites de 3CX ou des outils open-source, les développeurs accèdent à une solution puissante, comparable à celles proposées par des opérateurs haut de gamme, mais sans frais matériels ou licences propriétaires.

Du côté des performances, la téléphonie fonctionne globalement sans latence notable, selon les démonstrations disponibles. Les réponses vocales sont fluides, et les demandes plus complexes sont correctement transmises à Claude Code, qui les exécute avec fiabilité, dans le cadre de son environnement sécurisé.

Limitations et marges d’évolution

Malgré son potentiel, la solution n’est pas exempte de limites. La version gratuite de 3CX interdit les trunks SIP personnalisés, limitant les intégrations à certains cas d’usage. Elle demande également une maîtrise fine de la configuration réseau SIP, notamment pour la gestion NAT ou les codecs vocaux. De plus, certains services vocaux comme Synthflow requièrent un plan entreprise pour autoriser une connexion étendue.

D’autres pistes évoquent l’utilisation de WhatsApp SIP Calling sur la future version 20 de 3CX, ou l’intégration directe avec des fournisseurs soutenus tels que United World Telecom.

Vers des centres d’appels pilotés par IA

Ce projet s’insère dans une tendance montante des systèmes PBX enrichis par l’IA. Les entreprises peuvent ainsi convertir leur infrastructure téléphonique existante en plateformes intelligentes. Cela permet d’automatiser le support client, de qualifier des leads par téléphone ou de déployer des réceptionnistes virtuels capables de comprendre et exécuter des requêtes en langage naturel.

L’exemple de claude-phone montre qu’il est possible de démocratiser ces capacités avec des outils accessibles et simples à mettre en œuvre. Son architecture repose uniquement sur des standards ouverts et des solutions libres ou gratuites, accessibles aux développeurs ou petites structures sans moyens importants.

En transformant un simple appel téléphonique en une session de codage en langage parlé, cette intégration entre SIP, 3CX et Claude Code illustre une nouvelle ère de collaboration homme-machine. Elle rapproche la voix de l’automatisation logicielle. Une avancée symbolique — et désormais réalisable pour tous, en moins de 60 secondes.