Aller au contenu
Règlement du forum ×
IPTV et arnaques ×

Empecher ChapGTP de siphonner votre site à votre insu.


laliche

Messages recommandés

  • Modérateurs

Les performances de ChatGPT ne pouvaient être atteintes sans  une quantité astronomique de ressources obtenues des  diverses pages web en tout genre… dont fait potentiellement partie votre propre site web.. Sachez qu'il existe des solutions pour se prémunir de l'exploitation de vos textes par OpenAI.
Pour assurer son bon fonctionnement, la société qui l'a développé, OpenAI, a eu recours à une gigantesque base de données de contenus publiés et disponibles en ligne.
Pour alimenter les connaissances de ChatGPT, la firme a utilisé des livres, Wikipédia, des sites de presse, des publications Reddit,des forums de discussion,des blogs,....
Mais OpenAI ne  demande jamais l'autorisation d'exploiter votre contenu pour améliorer ses modèles de langage, et donc, ChatGPT.
L'entreprise ne vous rémunère pas non plus pour votre participation à l'évolution des capacités de son produit.
Vous pouvez avoir plusieurs raisons de souhaiter que le contenu de votre site ne soit pas siphonné par ChatGPT à ses fins d'entraînement, qu'elles soient d'ordre pratique et moral ou simplement éviter de surcharger votre site de requêtes par l'intelligence artificielle…

Voici comment empêcher ChatGPT d'exploiter le contenu de votre site web à votre insu:
 

Révélation

Voilà pourquoi nous vous présentons quelques astuces qui devraient vous permettre de bloquer l'accès aux contenus de votre site à ChatGPT.
1. Bloquer Common Crawl sur tout votre site grâce au fichier robots.txt
L'une des méthodes utilisées par OpenAI pour alimenter ses modèles de langage est Common Crawl. Il s'agit d'une organisation à but non lucratif qui a mis au point un robot baptisé CCBot.
Son but est d'explorer et d'analyser le Web pour fournir gratuitement des archives et des ensembles de données de contenus publiés sur Internet.
CCBot a recours au protocole robots.txt pour effectuer ses opérations de ce que l'on appelle « crawling » en anglais.
Ce fichier se trouve à la racine de votre site web, et son rôle est d'indiquer aux robots d'exploration les URL auxquelles il a le droit d'accéder sur votre domaine.
Pour bloquer CCBot, auquel a recours ChatGPT, sur l'ensemble de votre site web, ajoutez les instructions suivantes à votre fichier robots.txt :
User-agent: CCBot
Disallow: /


2. Utiliser une balise nofollow dans les métadonnées de son site web
Toujours pour limiter l'accès à vos contenus par CCBot, vous disposez de la possibilité d'ajouter une balise nofollow au sein des métadonnées de votre code HTML, qui sert à structurer et mettre en page votre site web.
Celle-ci va faire savoir aux robots que vous ne désirez pas que le contenu de votre site soit indexé. La balise en question est celle-ci :
<meta name="CCBot" content="nofollow">

3. Recourir à des captchas contre les robots
Les captchas sont une technique de sécurité très populaire sur Internet, et leur but principal est d'éviter la surcharge des sites web causée par des robots en leur imposant un test qu'ils ne sont pas censés réussir.
Cette solution n'est à recommander que si vous craignez également que des robots malveillants s'en prennent à votre site, notamment dans le cadre d'attaques par déni de service (DDoS).
En effet, ces captchas seront aussi imposés à vos visiteurs humains, ce qui peut détériorer leur expérience sur votre site web. Privilégiez donc les deux autres solutions que nous décrivons plus haut.

Ces quelques méthodes devraient suffire à empêcher dorénavant ChatGPT (et toutes les plateformes ayant recours aux bases de données constituées par les robots d'exploration) d'utiliser votre site web et les contenus qu'il héberge comme terrain de jeu.
Mais vous n'êtes bien sûr pas à l'abri que le chatbot ait déjà eu accès à vos ressources dans le passé.
Gardez aussi à l'esprit qu'il peut dans certains cas être intéressant de laisser les robots scanner son site, tous ne vous veulent pas du mal.

 

Modifié par laliche
Lien vers le commentaire
Partager sur d’autres sites

jessaye de m'inscrire pour tester chatgpt et ce depuis 20 jours....je seul message que je recois c'est:

 

"incription impossible veuillez ressayer plus tard"

jai essayé 3 navigateurs, 2 mails, et des VPN...mais RIEN !!!!!!!!!!!!!!!!!!!!! purée on fait comment pour s'inscrire ?!!!!!!!!!

 

 

 

Lien vers le commentaire
Partager sur d’autres sites

  • Modérateurs
il y a 13 minutes, genio a dit :

jessaye de m'inscrire pour tester chatgpt et ce depuis 20 jours....je seul message que je recois c'est:

 

"incription impossible veuillez ressayer plus tard"

jai essayé 3 navigateurs, 2 mails, et des VPN...mais RIEN !!!!!!!!!!!!!!!!!!!!! purée on fait comment pour s'inscrire ?!!!!!!!!!

 

 

 

C'est pas facile de s'inscrire au chatgtp d'Open Ai . Essaye les alternatives comme You.com ou celle de Bing

Lien vers le commentaire
Partager sur d’autres sites

  • Administrateurs
il y a 49 minutes, genio a dit :

jessaye de m'inscrire pour tester chatgpt et ce depuis 20 jours....je seul message que je recois c'est:

 

"incription impossible veuillez ressayer plus tard"

jai essayé 3 navigateurs, 2 mails, et des VPN...mais RIEN !!!!!!!!!!!!!!!!!!!!! purée on fait comment pour s'inscrire ?!!!!!!!!!

Tu as essayé sans VPN sans rien ? je connais des gens qui ont créé leur compte depuis l'Algérie sans soucis.

Lien vers le commentaire
Partager sur d’autres sites

c'est balise ne veulent rien dire leur bot peut juste les ignorer et crawl tout le site c'est balise sont faites juste pour les moteurs de recherche afin de leur indiquer que tu ne souhaite pas indexer un contenu mais rien n'enperche le bot de siphonner le site en question , et pour les captcha , il y a des solution automatique et semi automatique pour les bypass donc il y a rien a faire , en plus de ça chatgpt ne siphone par les sites web mais c'est plus openAI qui le fait afin de cree un model , ce model ne peut pas etre mis a jour en temps reel 

Lien vers le commentaire
Partager sur d’autres sites

Il y a 10 heures, hotsauce3 a dit :

c'est balise ne veulent rien dire leur bot peut juste les ignorer et crawl tout le site c'est balise sont faites juste pour les moteurs de recherche afin de leur indiquer que tu ne souhaite pas indexer un contenu mais rien n'enperche le bot de siphonner le site en question , et pour les captcha , il y a des solution automatique et semi automatique pour les bypass donc il y a rien a faire , en plus de ça chatgpt ne siphone par les sites web mais c'est plus openAI qui le fait afin de cree un model , ce model ne peut pas etre mis a jour en temps reel 

En même temps qui mets un captcha sur un site vitrine ? Ce n'est pas user friendly. ça se met pas n'importe où. En plus quel intérêt open IA aurait de scrap des données de sites internet qui ne sont pas de sites qui répertorient des informations utiles style Wiki. C'est comme construire un mur et un portail qui se ferme avec un cadenas autour d'une mairie qui est un lieu public ça n'a aucun sens, heu...wait, ça se fait pas dans un certain pays ? 😅

Modifié par parazitenew
  • Like 1
Lien vers le commentaire
Partager sur d’autres sites

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

  • Messages

    • Bonjour, Pas nécessairement.. une clef WiFi 5 (802.11ac) ne peux se connecter qu'à la bande de fréquence des 5 Ghz (qui n'est pas très bonne à longue portée) sauf si elle mentionne être compatible 802.11n/ac (qui accepte les deux bandes), alors qu'une clef wifi 6 te permet de te connecter sur les deux bandes 2.4 et 5Ghz d'office. Et puis comme tu le dis, il vaut mieux investir sur une clef qui peux servir à long terme!
    • La phrase a été dite juste après que le ministre a rappelé qu’AT est passé de 50 000 abonnés fibre en 2020 à 2 millions en 2025, ce qui montre une grosse avancée (car de l'ADSL à la Fibre il y'a un ENORME bond technologique), ajoutant qu’avec le Wi-Fi 7, AT continue de progresser sur le plan technologique (voulant donc expliquer que l'avancée du passage du wifi 6 au 7 est comparable à l'avancée de l'ADSL à la Fibre). C’est donc clair que cette phrase s’inscrit dans cette logique d’évolution. Je pense qu'il n y'a pourtant pas d'ambiguïté dessus.   Alors deux précisions :  L'affirmation selon laquelle WiFi 7 a été inventé par MediaTek depuis 2021 est inexacte, c'est une norme développée par l'IEEE avec la participation de plusieurs entreprises, dont MediaTek. Elle n'est donc pas l'inventeur du WiFi 7, mais plutôt un contributeur parmi beaucoup d'autres entreprises mondialement reconnues. La deuxième précision c'est que AT n'a pas l'air de mentir, il n y'a AUCUN opérateur en Afrique qui propose du WiFi 7 avec leur modem fourni. On ne parle pas du matos "caba" ou acheté ailleurs sur le marché, mais de ce que propose les opérateurs. Même en France les opérateurs se battent pour savoir qui a réellement lancé le WiFi 7 en premier (pourtant c'est des cadors!) sollicitant carrément la justice : https://www.zdnet.fr/actualites/mais-qui-a-le-vrai-wifi-7-bouygues-telecom-et-free-secharpent-en-justice-408111.htm   Même réponse qu'à laliche, elle est peut être fabriquée en Tunisie, mais aucun opérateur tunisien ne propose une offre fibre avec un modem fourni compatible WiFi 7. Donc, oui, AT reste le premier à le faire. Il n'est pas question de "lui appartenir", mais de qui l'a commercialisé en premier avec ses offres.   Je veux bien reprocher beaucoup de choses à AT, c'est une entreprise qui a beaucoup de défauts, mais je ne ferai jamais de bashing pour n'importe quoi.. il faut reconnaitre les choses quand elles sont bien faites, et pour le coup je salue ses améliorations ces dernières années. Maintenant il faut généraliser la fibre ailleurs que dans les trois ou 4 grandes villes ou ils se sont concentrés pour que ce soit à la portée de tous !
    • hahahaha 🤣 sérieux "Algérie Télécom lance le Wi-Fi 7, une première en Afrique" petit info pour AT les BOX d'orange europe "fanbox" 10 v2 avec WIFI 7 xgs-pon ect... elle et fabriqué en Tunisie....  "https://wikidevi.wi-cat.ru/Orange_Funbox_10_v2"  "https://www.youtube.com/watch?v=6woCBw359iU" c'est comme si la norme 802.11 leur appartient. mon routeur a presque 2 ans c'est un BE  "ROG GT-BE98 Pro" je parle meme pas des routeur au soc d'entre gamme ou milieu de gamme comme MediaTek Qualcomm HiSilicon qui sont sorti des routeur BE3600 be5000 ect..depuis fin 2022 debu 2023 a un prix correct entre 11000DA a 17000DA " c'est pas des machine de guerre mais ils fon leur boulot"  AT plus for que orange free et bouygue el houma et les autre operateur du monde ..🤣 " mieux AT et devenu un fabriquant de SOC semiconducteur 🤣 ..... ils ont meme pas capable de fournir des ONT ONU normal a leur clients ; surtout les client qui ont des OLT alcatel nokia qui attende depuis 6 mois voire plus d'une année pour d'autre ....  est AT  ils veulent propose du WIFI 7 🙃, le propose par quoi la ligne fibre 🤣🤣 "capable c'est des malade", y'a personne chez AT pour leur dire que la norme 11be c'est des chipset soc qui s'installe sur des routeurs AP ONT ect.... ou bien , je vien de remarqué un petit truc dans leur site idoom-market , ils propose un routeur TENDA TE6L PRO - WIFI 7 "hacha na3ma"   https://idoom-market.com.dz/fr/details/276 za3ma tout ça pour ça 🤣 c'est grave ..... lazem que AT propose des BOX comme tout le monde, avec un minimum des LAN 2.5gb avec du wifi 6 ou 7  ax3000 ax6000 ou BE6500.. c'est largement suffisant pour une utilisation quotidienne  du moment ya que la techno GPON, c'est le minimum syndical algerietelecom wakoulo yataalem 
    • Il faut rappeler que la technologie   wifi 7 est inventée par Mediatek depuis 2021 et est implémentée dans les modems comme le routeur Archer BE3600 en vente en Algérie depuis longtemps , qui sont des produits importés et  AT ne lance rien  ,aucune technologie Wifi , et n'a pas à se vanter du Wifi -7 qui est un produit inventé par d'autres comme si c'était le sien, là on n'est vraiment trop avancé dans le fantasme et le ridicule.  
    • on a meme pas le wifi 6 mais il ce permis  de parler de la wifi 7  qu'ils comprennent que on est pas un pays qui est gourmant de la bande passante on a pas bc de  consommateurs de la 4k ou 8k etc ....
×
×
  • Créer...