Explications Techniques

Localisation CAPTCHA : comment les paramètres linguistiques affectent les défis

Le même site Web présente un défi reCAPTCHA en anglais à un visiteur et en japonais à un autre. Un widget Cloudflare Turnstile affiche son texte de chargement dans la langue du navigateur. Certains sites proposent des types CAPTCHA complètement différents en fonction de la région détectée par le visiteur. Comprendre comment la localisation affecte les CAPTCHA vous aide à les gérer correctement dans l'automatisation.

Ce qui change avec les paramètres régionaux

Fournisseur CAPTCHA Ce qui localise Ce qui reste pareil
reCAPTCHA Texte de l'interface utilisateur, étiquettes d'image, langue audio Sitekey, flux de vérification, format de jeton
Tourniquet Texte du widget et messages d'erreur Sitekey, format de jeton, mécanisme de résolution
hCaptcha Instructions du défi, étiquettes de catégorie Clé de site, format de jeton
Image/OCR Jeu de caractères, langue du texte Format d'image, flux submit/poll

Comment la langue est détectée

Les fournisseurs CAPTCHA déterminent la langue à travers plusieurs signaux :

1. En-tête Accept-Langue

Accept-Language: ja-JP,ja;q=0.9,en-US;q=0.8,en;q=0.7

Cela indique au serveur : préférez le japonais (Japon), puis l'anglais (États-Unis), puis l'anglais générique. reCAPTCHA et Turnstile l'utilisent pour sélectionner la langue de l'interface utilisateur.

2. Paramètre HTML hl

reCAPTCHA accepte un paramètre de langage explicite lorsqu'il est chargé :

<!-- Force English reCAPTCHA -->
<script src="https://www.google.com/recaptcha/api.js?hl=en"></script>

<!-- Force Japanese -->
<script src="https://www.google.com/recaptcha/api.js?hl=ja"></script>

Le paramètre hl remplace l'en-tête Accept-Language. Lors de la résolution, vous n'avez pas besoin de faire correspondre cela : CaptchaAI renvoie un jeton quelle que soit la langue de l'interface utilisateur.

3. Localisation géo-IP

Certaines configurations CAPTCHA varient selon la région :

Signal Effet
PI de Chine Peut obtenir GeeTest au lieu de reCAPTCHA (reCAPTCHA est bloqué en Chine)
Propriété intellectuelle de l'UE Peut voir le consentement RGPD avant CAPTCHA
IP de la région restreinte Peut faire l'objet de défis plus stricts

4. Navigateur navigator.language

Les CAPTCHA basés sur JavaScript lisent le langage du navigateur :

navigator.language       // "en-US"
navigator.languages      // ["en-US", "en", "ja"]

Dans les navigateurs sans tête, ceux-ci sont par défaut les paramètres régionaux du système. Définissez-les explicitement pour qu'ils correspondent à votre cible :

// Playwright
const context = await browser.newContext({
  locale: 'ja-JP',
});

// Puppeteer
const page = await browser.newPage();
await page.setExtraHTTPHeaders({
  'Accept-Language': 'ja-JP,ja;q=0.9',
});

Impact sur la résolution

CAPTCHA basés sur des jetons (reCAPTCHA, Turnstile, hCaptcha)

Les paramètres de langue affectent l'UI mais pas le jeton. Le processus de résolution de CaptchaAI est indépendant du langage :

  • Soumettez la clé du site et l'URL de la page
  • CaptchaAI renvoie un jeton valide
  • Le jeton fonctionne quelle que soit la langue affichée par le widget CAPTCHA

Aucun paramètre de langue n'est nécessaire lors de l'appel de CaptchaAI pour les CAPTCHA basés sur des jetons.

CAPTCHA d’image

La langue affecte directement les caractères de l'image :

Langue du site Contenu CAPTCHA Paramètre de langue CaptchaAI
Anglais "Entrez le texte : XKCD42" 0 (par défaut/Latin)
russe "Введите текст: ШКАФ" 1 (cyrillique) ou 2
Chinois "请输入验证码 : 汉字" 2 (non latin)
arabe "أدخل النص: عربي" 2 (non latin)
Japonais "文字を入力 : ひらがな" 2 (non latin)

CAPTCHA audio

Les défis audio reCAPTCHA sont prononcés dans la langue correspondant au paramètre hl ou à l'en-tête Accept-Language. CaptchaAI les gère via son flux de résolution reCAPTCHA standard : la méthode de résolution ne dépend pas du langage audio.

Problèmes de localisation courants

Langage incompatible entre Scraper et Target

Si votre scraper envoie Accept-Language: en-US à un site japonais, le CAPTCHA peut s'afficher en anglais, ce qui convient aux CAPTCHA basés sur des jetons, mais peut entraîner des problèmes si le site valide la cohérence linguistique.

Différences régionales entre les fournisseurs CAPTCHA

Certains pays utilisent différents fournisseurs de CAPTCHA :

Région Fournisseurs typiques
Marchés occidentaux reCAPTCHA, tourniquet, hCaptcha
Chine GeeTest, Tencent CAPTCHA, image personnalisée
Russie/CIS CAPTCHA d'images personnalisées, reCAPTCHA
Corée du Sud Curseurs personnalisés, CAPTCHA d'image

Dépannage

Problème Parce que Corriger
reCAPTCHA affiche une langue différente de celle attendue Paramètre hl dans la balise de script et incompatibilité Accept-Language Le jeton est indépendant de la langue — n'affecte pas la résolution
Image CAPTCHA mauvais caractères reconnus Le paramètre de langue ne correspond pas au script CAPTCHA Définir language=2 pour les CAPTCHA non latins
Le site propose différents types de CAPTCHA par région Sélection de fournisseur basée sur la géo-IP Utiliser un proxy correspondant à la région cible
Le navigateur sans tête affiche des paramètres régionaux incorrects Paramètres régionaux du système par défaut utilisés Définir les paramètres régionaux explicitement dans le contexte du navigateur
CAPTCHA audio dans une langue inattendue Le paramètre hl remplace l'en-tête N'affecte pas la résolution basée sur les jetons CaptchaAI

FAQ

CaptchaAI a-t-il besoin de connaître la langue d'affichage du CAPTCHA ?

Pour les CAPTCHA basés sur des jetons (reCAPTCHA, Turnstile, hCaptcha), non. Le processus de résolution est indépendant de la langue. Pour les CAPTCHA Image/OCR, oui — définissez le paramètre language pour qu'il corresponde au jeu de caractères affiché dans l'image.

Dois-je faire correspondre mon en-tête Accept-Language au site cible ?

C'est une bonne pratique pour la cohérence. Certains sites vérifient les incompatibilités de langue entre les en-têtes et d'autres signaux. Définissez votre en-tête Accept-Language pour qu'il corresponde à la langue principale du site afin de minimiser le risque de détection.

La même clé de site peut-elle afficher une difficulté CAPTCHA différente selon les paramètres régionaux ?

Oui. Les fournisseurs de CAPTCHA peuvent ajuster la difficulté en fonction des scores de risque régionaux. Le trafic en provenance de certaines régions peut être confronté à des difficultés plus importantes. Cela n'affecte pas la résolution de CaptchaAI : l'API gère les défis de toute difficulté.

Prochaines étapes

Gérez les CAPTCHA dans n'importe quel paramètre régional –récupérez votre clé API CaptchaAIet configurez correctement les paramètres de langue.

Guides associés :

Les commentaires sont désactivés pour cet article.