Le même site Web présente un défi reCAPTCHA en anglais à un visiteur et en japonais à un autre. Un widget Cloudflare Turnstile affiche son texte de chargement dans la langue du navigateur. Certains sites proposent des types CAPTCHA complètement différents en fonction de la région détectée par le visiteur. Comprendre comment la localisation affecte les CAPTCHA vous aide à les gérer correctement dans l'automatisation.
Ce qui change avec les paramètres régionaux
| Fournisseur CAPTCHA | Ce qui localise | Ce qui reste pareil |
|---|---|---|
| reCAPTCHA | Texte de l'interface utilisateur, étiquettes d'image, langue audio | Sitekey, flux de vérification, format de jeton |
| Tourniquet | Texte du widget et messages d'erreur | Sitekey, format de jeton, mécanisme de résolution |
| hCaptcha | Instructions du défi, étiquettes de catégorie | Clé de site, format de jeton |
| Image/OCR | Jeu de caractères, langue du texte | Format d'image, flux submit/poll |
Comment la langue est détectée
Les fournisseurs CAPTCHA déterminent la langue à travers plusieurs signaux :
1. En-tête Accept-Langue
Accept-Language: ja-JP,ja;q=0.9,en-US;q=0.8,en;q=0.7
Cela indique au serveur : préférez le japonais (Japon), puis l'anglais (États-Unis), puis l'anglais générique. reCAPTCHA et Turnstile l'utilisent pour sélectionner la langue de l'interface utilisateur.
2. Paramètre HTML hl
reCAPTCHA accepte un paramètre de langage explicite lorsqu'il est chargé :
<!-- Force English reCAPTCHA -->
<script src="https://www.google.com/recaptcha/api.js?hl=en"></script>
<!-- Force Japanese -->
<script src="https://www.google.com/recaptcha/api.js?hl=ja"></script>
Le paramètre hl remplace l'en-tête Accept-Language. Lors de la résolution, vous n'avez pas besoin de faire correspondre cela : CaptchaAI renvoie un jeton quelle que soit la langue de l'interface utilisateur.
3. Localisation géo-IP
Certaines configurations CAPTCHA varient selon la région :
| Signal | Effet |
|---|---|
| PI de Chine | Peut obtenir GeeTest au lieu de reCAPTCHA (reCAPTCHA est bloqué en Chine) |
| Propriété intellectuelle de l'UE | Peut voir le consentement RGPD avant CAPTCHA |
| IP de la région restreinte | Peut faire l'objet de défis plus stricts |
4. Navigateur navigator.language
Les CAPTCHA basés sur JavaScript lisent le langage du navigateur :
navigator.language // "en-US"
navigator.languages // ["en-US", "en", "ja"]
Dans les navigateurs sans tête, ceux-ci sont par défaut les paramètres régionaux du système. Définissez-les explicitement pour qu'ils correspondent à votre cible :
// Playwright
const context = await browser.newContext({
locale: 'ja-JP',
});
// Puppeteer
const page = await browser.newPage();
await page.setExtraHTTPHeaders({
'Accept-Language': 'ja-JP,ja;q=0.9',
});
Impact sur la résolution
CAPTCHA basés sur des jetons (reCAPTCHA, Turnstile, hCaptcha)
Les paramètres de langue affectent l'UI mais pas le jeton. Le processus de résolution de CaptchaAI est indépendant du langage :
- Soumettez la clé du site et l'URL de la page
- CaptchaAI renvoie un jeton valide
- Le jeton fonctionne quelle que soit la langue affichée par le widget CAPTCHA
Aucun paramètre de langue n'est nécessaire lors de l'appel de CaptchaAI pour les CAPTCHA basés sur des jetons.
CAPTCHA d’image
La langue affecte directement les caractères de l'image :
| Langue du site | Contenu CAPTCHA | Paramètre de langue CaptchaAI |
|---|---|---|
| Anglais | "Entrez le texte : XKCD42" | 0 (par défaut/Latin) |
| russe | "Введите текст: ШКАФ" | 1 (cyrillique) ou 2 |
| Chinois | "请输入验证码 : 汉字" | 2 (non latin) |
| arabe | "أدخل النص: عربي" | 2 (non latin) |
| Japonais | "文字を入力 : ひらがな" | 2 (non latin) |
CAPTCHA audio
Les défis audio reCAPTCHA sont prononcés dans la langue correspondant au paramètre hl ou à l'en-tête Accept-Language. CaptchaAI les gère via son flux de résolution reCAPTCHA standard : la méthode de résolution ne dépend pas du langage audio.
Problèmes de localisation courants
Langage incompatible entre Scraper et Target
Si votre scraper envoie Accept-Language: en-US à un site japonais, le CAPTCHA peut s'afficher en anglais, ce qui convient aux CAPTCHA basés sur des jetons, mais peut entraîner des problèmes si le site valide la cohérence linguistique.
Différences régionales entre les fournisseurs CAPTCHA
Certains pays utilisent différents fournisseurs de CAPTCHA :
| Région | Fournisseurs typiques |
|---|---|
| Marchés occidentaux | reCAPTCHA, tourniquet, hCaptcha |
| Chine | GeeTest, Tencent CAPTCHA, image personnalisée |
| Russie/CIS | CAPTCHA d'images personnalisées, reCAPTCHA |
| Corée du Sud | Curseurs personnalisés, CAPTCHA d'image |
Dépannage
| Problème | Parce que | Corriger |
|---|---|---|
| reCAPTCHA affiche une langue différente de celle attendue | Paramètre hl dans la balise de script et incompatibilité Accept-Language |
Le jeton est indépendant de la langue — n'affecte pas la résolution |
| Image CAPTCHA mauvais caractères reconnus | Le paramètre de langue ne correspond pas au script CAPTCHA | Définir language=2 pour les CAPTCHA non latins |
| Le site propose différents types de CAPTCHA par région | Sélection de fournisseur basée sur la géo-IP | Utiliser un proxy correspondant à la région cible |
| Le navigateur sans tête affiche des paramètres régionaux incorrects | Paramètres régionaux du système par défaut utilisés | Définir les paramètres régionaux explicitement dans le contexte du navigateur |
| CAPTCHA audio dans une langue inattendue | Le paramètre hl remplace l'en-tête |
N'affecte pas la résolution basée sur les jetons CaptchaAI |
FAQ
CaptchaAI a-t-il besoin de connaître la langue d'affichage du CAPTCHA ?
Pour les CAPTCHA basés sur des jetons (reCAPTCHA, Turnstile, hCaptcha), non. Le processus de résolution est indépendant de la langue. Pour les CAPTCHA Image/OCR, oui — définissez le paramètre language pour qu'il corresponde au jeu de caractères affiché dans l'image.
Dois-je faire correspondre mon en-tête Accept-Language au site cible ?
C'est une bonne pratique pour la cohérence. Certains sites vérifient les incompatibilités de langue entre les en-têtes et d'autres signaux. Définissez votre en-tête Accept-Language pour qu'il corresponde à la langue principale du site afin de minimiser le risque de détection.
La même clé de site peut-elle afficher une difficulté CAPTCHA différente selon les paramètres régionaux ?
Oui. Les fournisseurs de CAPTCHA peuvent ajuster la difficulté en fonction des scores de risque régionaux. Le trafic en provenance de certaines régions peut être confronté à des difficultés plus importantes. Cela n'affecte pas la résolution de CaptchaAI : l'API gère les défis de toute difficulté.
Prochaines étapes
Gérez les CAPTCHA dans n'importe quel paramètre régional –récupérez votre clé API CaptchaAIet configurez correctement les paramètres de langue.
Guides associés :
- Jeu de caractères CAPTCHA pour images multilingues
- Résoudre les CAPTCHA sur les sites Web chinois
- Résoudre les CAPTCHA sur les sites Web japonais et coréens