recaptcha hcaptcha 설치와 재미있는 캡챠 이야기

CAPTCHA 캡챠 그게 뭐죠?

오늘은 captcha recaptcha hcaptcha 셋이 어떤 차이인지 알아보도록 할게요. 올해 유독 외국 스팸 댓글이 심각하게 달려서 삭제 및 스팸 버튼 누르기도 손이 아플지경이었습니다. 더이상 신경쓰기 싫어서 간단하게 해결해보고자 Captcha 플러그인을 설치하게 되었습니다. *CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart) : 컴퓨터와 인간을 구분하기 위한 공개 튜링 테스트

1세대 CAPTCHA – Louis Von Ahn

CAPTCHA를 처음 만든 사람은 루이스 폰 안(Louis Von Ahn)이라는 과테말라 출신의 기업가이자 카네기멜론 대학교 컴퓨터과학부 교수 입니다.

지금은 거의 잊혀졌지만 당시엔 최고의 포털 및 검색사이트였던 Yahoo는 스펨메일 계정 때문에 몸살을 겪었는데 이를 해결하기 위해 계정당 하루 500통 발신 제한을 걸었지만 엄청난 수의 계정을 자동생성하는 Bot 때문에 그런 노력은 의미가 없었습니다.

2000년 캡챠를 고안했을때 루이스 폰 안은 박사 과정 학생이었는데, 야후의 수석 과학자가 카네기멜론 대학에서 ‘야후가 해결하려고 했던 10가지 문제’에 대해 학생들과 토론했고 당시 박사과정을 밟고있던 루이스 폰 안이 이를 해결하게 되었습니다. 놀라운것은 이 기술을 개발한 뒤 야후에 무료로 제공했었다고 하네요.(야후 이놈들은 당시 대기업이었는데 보상을 두둑하게 해주지 그걸 낼름 받아먹니..)

인터넷이나 스마트폰 앱으로 영어 공부하시는 분들이 한번쯤은 설치해보셨을 ‘듀오링고‘의 공동 설립자이자 CEO가 루이스 폰 안 입니다. 똑똑하기도 하지만 그의 과거와 현재의 업적 모두 많은 사람들에게 큰 도움이 되는군요.

캡챠라는 방패가 나온 뒤 이를 뚫으려는 창 또한 진화하면서 2세대 CAPTCHA가 나오게 되었고 현재 가장 유명한 Anti-Bot system은 역시 구글의 reCAPTCHA 입니다. 그리고 후발주자로 Cloudflare가 밀고있는 hCAPTCHA가 있는데 작년 기준 15% 점유율이라고하니 나머지 85% 정도는 구글이 점령하고 있다고 봐야겠군요.

reCAPTCHA 유료화

클라우드플레어가 hcaptcha를 밀어준 이유는 아무래도 ‘비용’ 문제겠지요. 구글은 원래 recaptcha를 무료로 제공했었는데 2020년 상반기 유료화 발표 이후 hcaptcha를 선택했다고 발표했습니다.

구글은 카네기 멜론 대학교의 연구원들의 창업 프로그램 과정에서 개발한 recaptcha(리캡챠)를 2009년에 인수(여기에도 Louis von ahn이 포함되어있는데 이번엔 팔았군요 ㅎㅎ)했는데 초기에는 위 이미지 처럼 단어를 입력하는 수준이었습니다. 하지만 이런 모습은 더이상 볼 수 없죠. 여러분은 그동안 구글의 캡챠 이미지를 선택하면서 의문점을 가져보신적이 있으실까요?

거의 대부분 ‘도로’와 관련된 이미지들을 선택하게 합니다. 앞으로 인지하고 살펴보신다면 신호등, 자동차, 표지판, 횡단보도, 버스, 소화전 등 ‘운전자의 시각’과 관련된 이미지들이 압도적으로 많음을 알 수 있습니다. 이는 구글이 미래의 ‘자율주행’을 위해 AI 학습을 시키는 과정이라고 추측하는 의견들이 많습니다.

그게 사실이라면 우리를 포함한 전세계 수많은 사람들의 손가락이 구글의 자회사인 웨이모의 자율주행 자동차의 인공지능 소프트웨어를 똑똑하게 만든샘이 되겠군요.(구글이 정말 똑똑하고 사업을 잘하는 겁니다.) 위에서 말씀드린 루이스 폰 안의 2011년도 TED 영상(#)에 의하면 하루 2억건의 CAPTCHA가 입력된다고 했는데, 지금은 훨씬 규모가 커졌겠죠?

전방에 있는 것이 Self-driving sonsors, 상단에 있는 것이 Lidar system과 forward facing camera 그리고 사진에 보이지 않지만 후방에 레이더 센서가 있습니다. 라이다(Lidar)와 레이더(Rader)를 헷갈리실 수 있는데, 라이다는 주변을 3D 지도화하고 주행 환경을 파악하는 시스템 입니다.

구글이 리캡챠를 그동안 무료로 제공했던 것을 이야기하다가 여기까지 왔네요. 단순 자율주행을 위한 데이터 수집 용도가 아닌 리캡챠를 뚫으려는 ‘창’들의 노력때문에 계속 진화하는 것도 있습니다.(#) recaptcha는 v3버전까지 나와있습니다.

저의 경우 구글의 reCaptcha를 사용한 뒤 단 한건의 스팸 댓글도 없었습니다. 위 처럼 하루에 얼마나 성공하고 실패했는지 통계도 나옵니다.

한달정도 사용해봤으니 이제 hCaptcha를 사용해보고 큰 차이가 없으면 정착할 예정입니다.

Cloudflare가 밀어주는 hCAPTCHA

구글이 돈을 내라고하니 트래픽이 어마어마한 Cloudflare는 다른 캡챠 시스템을 선택하게되었는데 그게 hCAPTCHA 입니다. 클라우드플레어가 개발한 것은 아니고, Intuition Machines라는 곳에서 만들었습니다.

가운데 보시면 Gigantic을 구글 색으로 해놨군요. ㅎㅎ h캡챠 소개의 핵심은 “구글의 리캡챠는 방문자를 제품으로 간주하지만 우리 h캡챠는 사용자가 누군지 신경쓰지 않으며 구글같은 거대한 광고회사에 제공되지 않는다.” 이런 내용 입니다.

워드프레스 기준으로 hcaptcha 설치 방법

우선 가입하려면 [바로가기]로 가서 간단하게 하실 수 있습니다.

중간에 있는 Sign Up now 버튼이나 상단 우측에 있는 Signup을 눌러주세요.

왼쪽 상단에 보이는 Add hCaptcha to your service(free) 눌러줍니다.

저는 Github 아이디로 가입했습니다. 구글 reCaptcha의 후발 경쟁자인 hCaptcha를 가입하는데 구글아이디 쓰는 것도 좀 이상하네요.ㅎㅎ 그리고 Authorize hCaptcha 깃헙 페이지가 나오면 승인해줍니다.

사이트키 그리고 시크릿키 두개가 나옵니다. 복사해두세요. 워드프레스 플러그인 설치페이지. 워드프레스 플러그인 메뉴에서 추가하시는게 더 편합니다. 워드프레스에 추가할때 가장 마음에 들었던 부분 입니다. recaptcha의 경우 구글에서 공식적으로 제공하는 플러그인이 없어서 처음에 검색했을때 여기저기서 만든 플러그인들 때문에 헷갈리고 뭔가 찝찝했는데 hCaptcha는 공식 플러그인을 등록해두었습니다.

워드프레스에서 추가하시구요.

설정 > hCaptcha 메뉴로 가셔서 사이트키, 시크릿키 입력하신 뒤에 활성화할 부분만 체크하시면 됩니다. 저는 로그인폼, 댓글폼 두개만 선택했습니다.

그리고 hCaptcha Dashboard 페이지에서 Sites로 들어가세요.

아까 처음 계정 생성뒤에 나왔던 디폴트 사이트 설정이 하나 있습니다. 거기에 들어가셔서 위 처럼 사이트(블로그) 주소를 입력해주세요.

잘 적용되는군요^^.

(나중 후기) – 뚫립니다. ㅜㅜ – hCaptcha 스팸 댓글 봇에 뚫리는군요.

4 Comments

  1. 헐 대박 요즘 구글 캡챠 너무많이나와서 짜증반 체념반으로 이미지 누르는데 질릴정도인데 트럭,차, 오토바이, 자전거, 신호등 등 이미지가 많이 나오는이유가 그런이유였었군요 저로서는 생각도못했네요;; 그냥 매번 클릭하는거여서 따로 생각해본적은없는데 배워가네요
    넷헥님이 댓글에 캡챠를 도입한이유도 넷헥님블로그가 전문성을 짙게 띄어서 스팸댓글이 많이 달리는이유가있었네요

    예전엔 글자로 입력하는 캡챠는 재밌었는데 구글그림 캡챠 한번에 안끝내줘서 너무 힘드네요… ㅠ ㅋㅋㅋㅋ
    흥미로운 정보글 잘봤습니다

    1. 스팸이 진짜 감당이 안될정도로 엄청나더라구요 ㅜㅜ 댓글 달아주셔서 감사합니다~

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다