태그 보관물: PageRank

Apache 재단에 700만원을 후원하면 생기는 일

세계에서 가장 큰 오픈소스 재단인 Apache Software Foundation ( ASF )

잘 알고 있는 아파치 웹서버부터 Hadoop,Spark,Cassandra,Kafka 등 요즘 대부분의 회사에서 사용하는 수많은 오픈소스들이 아파치 프로젝트로 등록되어있습니다. 현재 등록된 프로젝트가 366개니까 아파치 산하 프로젝트들이 없으면 IT업계가 돌아가지 않는다고도 얘기할수 있습니다.

올해가 아파치재단 설립 20주년이네요. 그 동안의 노력과 헌신에 감사 드립니다.

이 글은 약간 재미성으로 읽어주시면 좋을 거 같아요.

아파치 재단은 저 많은 프로젝트를 원활히 후원하기 위해, 기부를 받고 있습니다.
그리고 지속해서 기부를 받기 위한 스폰서쉽 프로그램도 운영하는데요.
총 4가지의 후원프로그램이 있습니다.

  • Platinum : 년 $125,000 – AWS, MS, Facebook, Google 등
  • Gold : 년 $50,000 – IBM, ARM, Bloomberg, Huawei 등
  • Silver : 년 $25,000 – CapitalOne, Redhat, Baidu, Target, Alibaba Cloud
  • Bronze : 년 $6,000 – Twitter, PureVPN 등

Thanks 페이지에 보면 위와 같이 매우 많은 회사들이 기부에 참여 하고 있습니다.

글 제목에 있는 700만원은 Bronze 등급이라고 보시면 되는데요. 왜 글 제목을 저렇게 적었을까요?
Bronze 스폰서의 전체 리스트는 아래와 같습니다.

제가 형광펜으로 표시한 곳에는 우리가 스팸 댓글에서나 볼법한 특이한 이름들이 보입니다. 저곳들이 오픈소스를 잘 사용해서 고맙다고 기부를 하는 거는 아닐 거 같아요. 물론 형광펜 안친 곳들도 오픈소스와는 연결 안 되어 보이는 회사들도 많습니다.

그럼 다시 Bronze 스폰서를 하면 아파치 재단이 주는 것들을 가져와 봅니다.

내 사이트에 후원자 로고를 가져다 쓸 수 있고, 년간 보고서에 등록된다는 군요.
근데 후원금 뒤에 바로 나오는 형광펜 친 항목이 중요합니다.

  • ASF 후원페이지에 ‘nofollow‘ 를 붙인 채로 링크가 표시됩니다.
    • 페이지 하단부에 텍스트로 언급
    • 알파벳 순서
    • 한 줄에 여러 개 표시됨
    • 2년 이상 후원 시 “follow” 링크로 표시됩니다.

이게 무슨 말일까요 ? 이 내용을 설명하는 게 이 글의 주제입니다.

사전지식 1 : Google 의 PageRank

구글이 이 세상에 존재하게 했던 논문인 “The Anatomy of Large-Scale Hypertextual Web Search Engine” 에서 소개된 PageRank 알고리즘은 변화해왔지만 아직도 구글 검색 엔진의 핵심입니다. 쉽게 읽어보시려면 ‘쉽게 설명한’ 구글의 페이지 랭크 알고리즘 를 보시면 됩니다.

짧게 설명하면 아래와 같습니다.

좋은 웹페이지는 다른 사이트로부터 많은 링크를 받게 되어있고, 이런 사이트는 PageRank가 높다. 그러므로 PageRank가 높은 페이지가 어떤 페이지를 링크한다면 링크된 페이지의 PageRank가 높아진다.

오래되었지만, 제가 2011년에 만든 “모바일시대의 SEO전략” 자료를 한번 보셔도 좋습니다.

내 웹사이트의 PageRank가 높으면 구글 검색 결과에서 상위에 표시될 테니, 당연히 PageRank 가 높은 사이트에 내 사이트의 링크가 걸리면 좋겠죠.

사전지식 2 : A 태그의 rel=nofollow

<a href="https://xguru.net" rel="nofollow">

웹의 기본인 링크는 A 태그로 구성되어 있습니다. 브라우저들이 이 태그를 보고 웹사이트 방문자들이 클릭할 수 있는 형태로 바꿔서 표시하죠. 그런데 사람 말고 검색엔진의 크롤러(Web Crawler)는 어떨까요 ? 검색엔진의 크롤러들은 웹페이지를 읽은 후 A 태그를 모두 뽑아내어 거기서 다른 사이트로 이동을 합니다. (그 내부의 robots.txt 같은 복잡한 내용들은 다 제거하고 설명합니다. )

그런데, 그냥 이동을 하다 보면 아까 말한 PageRank 에 나쁜 영향을 주는 상황이 발생합니다. 예를 들어, 내 사이트 댓글에 누가 스팸성으로 불법 사이트 링크를 막 달았다고 생각해보면 됩니다. 내 사이트의 PageRank 를 불법 사이트 한테 나눠주는 일이 생기겠죠. 그래서 rel=”nofollow” 라는게 등장합니다. 크롤러 보고 이 사이트는 따라 가지 말라고 지시하는거죠. 사람은 상관없구요.

자 이제 1과 2를 조합하면 앞의 내용이 이해가 됩니다.

아파치재단의 PageRank 는 측정도구로 보면 9 입니다. 네이버가 8인데 네이버보다도 높아요.
재미난건 google.com 도 9점이에요. 10점은 누가 있을까요? 바로 Youtube.com 과 facebook.com 입니다. ( PageRank 의 실제값은 공개되어있지 않습니다. 그냥 추측한 값들이에요 )

즉, 1년 후원시 내 사이트의 링크가 rel=nofollow 붙은채로 PageRank 9 인 아파치 재단에 링크가 걸리게 됩니다. 거기다 2년 이상 후원을 하게 되면 follow 링크라는건 존재하지 않으니, rel=nofollow 를 삭제해 줍니다. 즉 일반 A 태그로 PageRank 9 짜리에 내 사이트 링크가 걸리는 거죠.

“매년 7백만원만 내면 PageRank 9 짜리 아파치재단에 내 사이트 링크가 걸린다고?”

이게 저 오픈소스와 연관없는 사이트들이 아파치재단에 매년 후원을 하는 이유입니다. 저 사이트들은 검색순위에 목숨걸고 광고도 할 정도인데, 저 정도 비용은 사실 큰게 아닐거 같아요.
저 follow 링크가 어느정도 영향을 미치는지는 사실 정확히 알려져 있지 않습니다. 논문의 내용상 그럴수도 있다는 거구요. ( 물론 그게 어느정도 잘 동작해왔다는건, 오랜시간의 경험으로 다 아는 거죠. )

실제로 이렇게 하는거는 구글의 웹마스터 Link Schemes 가이드라인과 충돌하는거 같기는 한데요. Wayback Machine 으로 돌려보니, 딱 올해부터 이런 경향이 나타난듯 합니다. 작년에는 이런 링크들이 없었거든요. 아마도 곧 구글의 제재가 오지 않을까 생각이 들기도 합니다.

왜 아파치 재단 스폰서에 이상한 회사들이 등록될까에 대한 궁금증이 해결되셨음 합니다.

재미로 적은 글이지만 이 글에서 건져갈 것

  • SEO ( Search Engine Optimization ) 는 여전히 매우 중요하다.
  • PageRank가 높은 사이트에 내 사이트가 링크되면 좋다. 그러기 위해 좋은 콘텐츠를 만들자.
  • 내 사이트에 걸린 링크가 혹시나 의심된다면 rel=nofollow 를 붙이자. ( 댓글 에는 필수 )