Namecheap.com - Cheap domain name registration, renewal and transfers - Free SSL Certificates - Web Hosting

MFA сайты. Общая информация.

Saturday, July 2nd, 2011

Собственно MFA – это Made for Adsense или Made for Ads, другими словам созданные специально для показа рекламы, контент как правило вторичен. Почему стала интересна эта тема? Well, последние пару месяцев в среде вебмастеров с которыми я общаюсь стало модным меряться “доходами” с адсенса на белых проектах, однако особых успехов пока нет, за прошлый месяц с одного сайта накапало 17$. Маловато…но даже 2$ в сутки = 60$ в месяц, а это уже тот профит с которого можно покупать разные гаджеты или раз в год менять ноутбук. Если понемногу заниматься mfa сайтами вполне реально добиться небольшого cash flow в сутки, для этого нужна сеть сайтов и какой-то простой движек для их создания.

Немножко данных с сайтов по адсенсу. По порядку :

  • Page views – просмотры
  • Clicks – клики по адсенсу
  • Page CTR (clicks trough rate) процент кликов по отношению к просмотрам страницы
  • CPC (Cost per click) – средняя стоимость клика
  • Page RPM (revenue per thousand impressions) – доход с 1000 просмотров
  • Earnings – собственно деньги

Russia 39,929 140 0.35% $0.08 $0.29 $11.65
United States 1,092 10 0.92% $0.26 $2.40 $2.62
Ukraine 13,916 15 0.11% $0.13 $0.14 $1.90

Сразу бросается в глаза 2ая строка – United States, всего 1000 просмотров (это где-то 200-300 траффика *за месяц*, при условии что смотрят как правило более одной страницы) принесли 2.62$. Хмм уже интересно, особенно если сравнивать с Russia и Ukraine. + низкий CTR наверняка можно увеличить, реклама висит не на самом видном месте.

Ближе к делу. Создание MFA сайтов.

Для создания mfa сайтов нужна платформа. Есть несколько вариантов – либо рендерить статику (html), либо написать что-то вроде мини-цмс на django/flask/whatever с базой данных sqlite (чтобы не возникала необходимость под каждый сайт создавать БД, если сайтов много то это сущий ад) в стиле “залил и забыл”.

Преимущество статики – будет работать на любом хостинге, не требователена к ресурсам, но для любого изменения нужно рендерить сайт заново. С движком для статик-сайтов не придется даже изворачиваться – на гитхабе их полно (pelican, blogofile, hyde). Нет проблем взять любой и переделать малой кровью (по необходимости), фактически нужно будет просто создать несколько шаблонов, что как бы несложно, особенно если не верстать с нуля, а облагородить уже готовые для вордпресса.

Мини-цмс, особенно на django или flask конечно же не получится ставить где угодно зато сам двиг можно периодически апдейтить, и иметь все удобства по работе с контентом (загрузка файлов, WSGI редактор, создание новых страниц). Ну по идее ничего не будет мешать точно так же отрендерить сайт в статику и залить куда нужно.

Оба варианта имеют свои плюсы и минусы. В идеале, если конечно заниматься серьезно, придется орудовать как динамикой так и статикой, причем статика скорее всего предпочтительней по той простой причине что сайты нужно будет раскидывать по разным ипам, а брать постоянно вдсы, пусть даже за 10 баксов слишком затратно. Статику же потянет любой хостинг за бакс, который проще оплатить сразу на длительное время (на год например).

Что в интернетах?

А в интернетах пишут про индусов которые рубят килобаксы на адсенсе. В сети очень много разной информации, часть откровенный бред “продвигаторов”, часть можно взять на карандаш.

У гугла присутствует русскоязычный блог про адсенс, очень хороший, рекомендую ознакомится – http://adsense-ru.blogspot.com/. Так можно поискать информацию на иностранных форумах вроде http://forums.digitalpoint.com/.

Далее я выделил основные моменты, на которые, как мне кажется стоит обратить внимание :

  1. тщательная проработка шаблонов, они должен быть сделаны по всем правилам, а это значит валидный html, грамотно обозначенные метатэги, возможно микроданные/микроформаты, исключение дублирования контента (тэги/категории закрытые от индексации), красивые урлы (их еще называют ЧПУ, /how-to-do-it вместо /?p=10&c=1)
  2. Если приходить на сайт юзер будет с поисковиков, то нужно стараться сделать так чтобы выходил он через клик по адсенсу, больше делать ему на сайте нечего.
  3. Ходят слухи что существуют методики покупки дешевого траффика на mfa сайты и конверта его в плюс, так называемый арбитраж, ну чтож может быть…может быть.
  4. Может забанить гугл. Видел несколько сайтов с акками в бане, но там совсем все печально с контентом.
  5. Помимо адсенса эти сайты можно монетизировать другими способами. Товары от амазон, продажа ссылок. В конце концов сайты это ликвидный товар сам по себе. Как правило чем больше у вебмастера сайтов в активе, тем лучше.
  6. MFA сайты чаще всего окучивают НЧ запросы (микрониши). На таких веб-сайтах как ehow ключевым компонентом является алгоритм подбора ключевых фраз с низкой конкуренцией и потенциально высоким CPC. Рядовым сайтостроителям придется искать такие кейворды самостоятельно.
  7. Вероятнее всего имеет смысл использовать гео таргетинг (например “рыбалка в…”). Ну это вообще один из последних трендов.

Все это и так должно быть понятно опытному вебмастеру. По поводу Mini-CMS for MFA sites, я сейчас накидаю по быстрому на django и выложу на гитхабе.

Ух, Гугл!

Monday, June 27th, 2011

Многие уже забыли о том что есть такой параметр как PR сайта (который первый в тулбаре seoquake). И вот буквально сутки назад он внезапно обновился. Говорят апдейт хороший, годный, многие вебмастера рапортуют о существенных изменениях в большую сторону ([GFB]DrunkMonk охарактеризовал это как инфляцию пэйджранка). Вот и я в первую очередь проверил блог и обнаружил 1->2, в ообщем как-то даже не знаю, что-то в плюс, что-то в минус, никаких резких падений и увеличений. Гавносайтов пачка получила хороший ап, но кто их считает?

Хотя гугл и продолжает заявлять что влияние этого параметра на ранжирование существенно уменьшено, но тем не менее многим приятно, к тому же, как правило именно PageRank используется для оценки стоимости ссылок с сайта.

Несколько причин хостить jQuery у Google

Thursday, June 9th, 2011

Сейчас трудно представить проект который бы не использовал jQuery, её используют для создания анимации, эффектов и всех этих новых веб 2.0 красивостей, которые позволяют сохранять дизайн минималистичным, но в то же время поддерживать хороший експириенс юзера от работы с сайтом.

Часто делают так :

Вы делаете так же? Перестаньте – такой подход во многом не верен, нет никаких причин размещать эти файлы у себя. Я рекомендую использовать сервис гугла Google AJAX Libraries – чтобы подгружать такой контент напрямую с (ближайших) серверов гугла.

Какие преимущества даёт такое размещение?

Уменьшается задержка (отклик) – библиотека подгружается быстрее.
Параллелизм – пока загружается jQuery, ваш сервер отдаёт остальной контент.
Кэширование : если пользователь серфил интернет – наверняка многие библиотеки с CDN гугла закэшировались браузером.
Уменьшается нагрузка на сервер – так же неплохо будет облегчить свою страницу на 30+кб

Собственно есть 2а метода :



или старый добрый



1000 наиболее посещаемых сайтов интернета.

Wednesday, January 5th, 2011

Первый пост в новом году, поздравляю всех читателей блога с Новым Годом! Главное свежие идеи и обучаемость, бабло же как правило приложится.
Вообщем обнаружил топ 1000 от гугла, решил записать, чтобы не забыть.

The 1000 most-visited sites on the web

You can see a list of the largest 1000 sites worldwide, based on Unique Visitors (users), as measured by Ad Planner. This list is updated monthly as new Ad Planner datasets are released. The list defines sites as top-level domains.

Как превратить google translate в драм-машину?

Wednesday, December 1st, 2010

Есть такая фича в google.com/translate – пасхальное яйцо от гугла. Появилось в треде на reddit.com – и там еще много готовых “пресетов”

  1. Идем на google translate
  2. Ставим перевод с немецкого на немецкий (german to german)
  3. Копипастим это в гугл транслейт : pv zk pv pv zk pv zk kz zk pv pv pv zk pv zk zk pzk pzk pvzkpkzvpvzk kkkkkk bsch <<< или жмем сразу сюда.
  4. Жмем Listen
  5. Радуемся :)

Используя таблицу можно составить драм-паттерн самому :

  1. zk = suspended cymbal
  2. bschk = snare
  3. pv = brush
  4. bk = bass
  5. tk = flam1
  6. vk = roll tap
  7. kt = flam2
  8. kttp = flam tap
  9. krp = hi hat tap
  10. pv = short roll
  11. th = better hi hat
  12. thp, ds = instant rimshot.

Распределенные поисковые системы. majestic12.

Thursday, November 25th, 2010

Фантастика! А такие есть…. Пару дней назад рассматривая бегающих туда-сюда по блогу ботов наткнулся на – http://www.majestic12.co.uk/

Majestic-12 усердно работает над созданием World Wide Web поисковика основанного на концепции распределенных вычислений, таким же образом как и проекты типа SETI@home.

т.е. проект работает за счет того, что энтузиасты по всему миру расшаривают вычислительные ресурсы своих компьютеров помогая поисковику индексировать страницы. Отсюда следует немаловажный вывод – ботов нельзя отсечь используя список IP адресов, и бывает они создают достаточно серьезную нагрузку на ресурс который индексируют, заблокировать ботом можно только через robots.txt. Скачать клиента можно тут :
http://www.majestic12.co.uk/projects/dsearch/download.php

Поисковые технологии потихоньку развиваются, гуглу приходится все труднее т.к. со все сторон его атакуют различные набольшие проекты, конечно вряд ли он сдаст свои позиции в скором времени, но тем не менее здоровая конкуренция всегда идет на пользу рынку. У гугла сейчас есть крайне неприятная проблема – сайты контент-помойки, вроде ehow, mahalo и т.д. Уже недостаточно написать хорошую статью чтобы оказаться в топе поисковика, нужны кучи бэклинков – обычный человек никогда не будет этим заниматься, в то время как в топах зависают сайты с миллионами входящих бэков контент для которых пишут дешевые копирайтеры-индусы. В итоге что-то действительно полезное найти становится все труднее. И это как говорится – suck.

динамика развития majestic-12
http://www.majestic12.co.uk/projects/dsearch/stats.php
Индекс Majestic-12 уже достаточно внушителен и динамика развития проекта радует глаз. Не такая уж новая идея распределенных вычислений идея была реализована и теперь у разработчиков в руках находится огромное кол-во данных для анализа. И они извлекают из этого какую-то прибыль – продают доступ на сервис http://www.majesticseo.com/

Гугл вводит новую фишку в поиск – предпросмотр страниц.

Wednesday, November 10th, 2010

Буквально вчера на русском блоге гугла появилось описание новой фишки гугла – предпросмотр страниц.

Теперь, просматривая миниатюрные изображения веб-страниц, вам будет еще проще выбрать нужный сайт!

Предпросмотр страниц показывает, как выглядят найденные Google веб-страницы. Он выделит самые актуальные для вас разделы и позволит вам легко найти нужные результаты, как если бы вы листали журнал. Чтобы воспользоваться новой функцией, нажмите на значок «лупы» рядом с заголовком любого результата поиска.

Другими словами получается следующий замес. С одной стороны юзер будет автоматически скипать свинские сайты/доры, но в то же время можно увеличить CTR с SERP на свою страницу привлекательным дизайном. Вообщем сейчас нужно стараться повышать quality (качество) своих сайтов.

Вторжение войск Никарагуа в Коста-Рику ориентриующихся по Google Maps

Tuesday, November 9th, 2010

Почитал на ленте – посмеялся ) Хорошо хоть не ГЛОНАСС использовали. Однако пытливый читатель отметит “что-то здесь не так”, а именно :

Большинство СМИ отмечает, что правильный вариант карты этой местности предлагает один из главных конкурентов Google – поисковик Bing, принадлежащий Microsoft.

Вебмастерская общественность в последние дни была взбудоражена активными боевыми действиями в кибер-пространстве между тов. Гусевым (Desp) и господином Врублевским (RedEye) или по простому говоря фарма-войны с привлечением продажных депутатов/журналистов и силовых структур на радость последним. Тут же масштаб побольше – Сережа и Ларри vs. Билл и Стив или Google vs. Microsoft.

Googletestad

Thursday, November 4th, 2010

Изучая серчспай одного метапоисковика, заметил большое кол-во повторяющихся поисков по кею googletestad
WTF? ищу в гуле http://www.google.com/search?client=ubuntu&channel=fs&q=googletestad&ie=utf-8&oe=utf-8 нахожу такой сайт http://www.googletestad.org/

The WordTracker Keywords Report dated August 9, 2005 (top 10 queries from the last 48 hours) reported:

1. jessica simpson (3377)
2. jessica alba (3314)
3. music lyrics (2679)
4. daniela hantuchova (1955)
5. paris hilton (1469)
6. playstation 2 cheats (1243)
7. xbox cheats (1231)
8. jokes (1069)
9. googletestad (1048)
10. google (1013)

Согласно вики этот запрос используется для тестирования адвордса и адсенса.

Проверка количества проиндексированных страниц в Google

Tuesday, September 7th, 2010

Как определить кол-во проиндексированных страниц в гугле? реализация на Python. Недавно нужно было срочно, написал :

import urllib
import re

from urllib2 import urlopen
from urlparse import urlparse
from urllib import FancyURLopener

class GOpener(FancyURLopener):
    version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.6) Gecko/2009011913 Firefox/3.0.6'

def web_getpage(url):
    g_opener = GOpener()
    page = g_opener.open(url)
    return page.read()

def get_index(url):
    request = 'http://www.google.com/search?q=site:' + url
    # About 105,000,000 results
    index = 0
    try:
        gs = web_getpage(request)
        p = re.compile('About (.*) results')
        index = int(p.findall(gs)[0].replace(",", ""))
    except SearchError, e:
        index = -1
        #print "Search Failed : %s" % e
    finally:
        #print "Index: %d\tURL: %s" % (int(index), url)
        return index

Проверка Google PR на Python

Tuesday, August 31st, 2010

Собственно рабочая функция проверки Google Page Rank :

import urllib, sys

def get_pagerank(url):
    hsh = check_hash(hash_url(url))
    gurl = 'http://www.google.com/search?client=navclient-auto&features=Rank:&q=info:%s&ch=%s' % (urllib.quote(url), hsh)
    try:
        f = urllib.urlopen(gurl)
        rank = f.read().strip()[9:]
    except Exception:
        rank = 'N/A'
    if rank == '':
        rank = '0'
    return rank

def  int_str(string, integer, factor):
    for i in range(len(string)) :
        integer *= factor
        integer &= 0xFFFFFFFF
        integer += ord(string[i])
    return integer

def hash_url(string):
    c1 = int_str(string, 0x1505, 0x21)
    c2 = int_str(string, 0, 0x1003F)

    c1 >>= 2
    c1 = ((c1 >> 4) & 0x3FFFFC0) | (c1 & 0x3F)
    c1 = ((c1 >> 4) & 0x3FFC00) | (c1 & 0x3FF)
    c1 = ((c1 >> 4) & 0x3C000) | (c1 & 0x3FFF)

    t1 = (c1 & 0x3C0) << 4
    t1 |= c1 & 0x3C
    t1 = (t1 << 2) | (c2 & 0xF0F)

    t2 = (c1 & 0xFFFFC000) << 4
    t2 |= c1 & 0x3C00
    t2 = (t2 << 0xA) | (c2 & 0xF0F0000)

    return (t1 | t2)

def check_hash(hash_int):
    hash_str = '%u' % (hash_int)
    flag = 0
    check_byte = 0

    i = len(hash_str) - 1
    while i >= 0:
        byte = int(hash_str[i])
        if 1 == (flag % 2):
            byte *= 2;
            byte = byte / 10 + byte % 10
        check_byte += byte
        flag += 1
        i -= 1

    check_byte %= 10
    if 0 != check_byte:
        check_byte = 10 - check_byte
        if 1 == flag % 2:
            if 1 == check_byte % 2:
                check_byte += 9
            check_byte >>= 1

    return '7' + str(check_byte) + hash_str

print get_pagerank("http://twitter.com")

Постинг в wordpress.

Tuesday, August 18th, 2009

Частенько вебмастера балуются автоблогами, некоторые делают это хорошо, некоторые штампуют откровенный шлак по типу дорвеев и репостилок фидов, вообщем не суть, я бы посоветовал подумать и делать хорошо, чтобы потом не жаловаться на гугл. Но для того, чтобы реализовать подобное нужно уметь запостить в свой же блог, задача не сложная, но тем не менее ей нужно уделить какое-то время, рассекая просторы интернетов наткнулся на уже готовое решение, которое позволит сделать все элегантно и с минимальными усилиями :

import wordpresslib
url = 'http://www.mysite.com/wordpress/xmlrpc.php'
wp = wordpresslib.WordPressClient(url, 'username', 'password')
wp.selectBlog(0)
post = wordpresslib.WordPressPost()
post.title = 'Post title'
post.description = 'Post content'
idPost = wp.newPost(post, True)

Заявленные функции :

  • Создание новых постов
  • Редактирование старых
  • Публикация “черновиков” (т.е. ранее сохраненных но неопубликованных)
  • Удаление постов
  • Изменение категорий привязанных к посту
  • Информация по  блогу и пользователям
  • Загрузка мультимедиа файлов (фотографии & видео)
  • Получить последний пост/пинги/трекбэки

Анализ Google SERP на Python

Tuesday, August 11th, 2009

Хотел написать для начала, что нибудь вроде  “Выдача гугла – бесценный источник информации”, ну да ладно, все мы знаем зачем вебмастеру понадобилось вдруг анализировать топы гугла по спискам кейвордов или хуже того парсить урлы/отслеживать позиции сайтов =) вообщем предельно ясно, что задача анализа результатов выдачи возникает часто и найти применение результатам не проблема. Сложность только в том, что нужно писать код, причем желательно быстро и с минимальными усилиями. Помимо самих SERP было бы неплохо узнать и ключевые параметры – PR (PageRank) и Index, полезная информация, я гарантирую. Некоторое время назад, я кодил на PHP, потом бросил, бесит отсутствие строгой типизации (и потоков, да и тем кто с детства привык к красоте и логичности кода на Object Pascal/C++ пхп должен быть глубоко противен), еще и что-нибудь вроде WAMP/XAMPP поднимать на локальном компе. Python ничуть не хуже все к чему привыкли на PHP есть и на Python.

Для желающих приобщиться доступен Complete and Ready-to-Install industry standard Python distribution – после установки можно сразу приступать к работе, именно в таком виде должен поставляться язык программирования.

Итак для начала нужно получить данные от гугла, можно попробовать делать это через curl/liburl, но это hard-style, если погуглить можно легко найти уже готовые решения. Я уже озаботился в свое время поиском библиотеки, поэтому сразу даю линк на пост автора – Python Library for Google Search, с примерами и описанием. Библиотека избавляет вас от деталей предоставляя интерфейс позволяющий легко и изящьно работать с выдачей. Просто закиньте содержимое архива в Python\Lib или в папку где находиться ваша программа.

Код шлет запрос к гуглу и выводит в окно Python Shell результаты, обратите внимание на конструкцию try/except – позволит избежать остановки программы в случае ошибки :

from xgoogle.search import GoogleSearch, SearchError
try:
  gs = GoogleSearch("hot black chicks", random_agent=True)
  gs.results_per_page = 10
  results = gs.get_results()
  for res in results:
    print res.title.encode('utf8')
    print res.desc.encode('utf8')
    print res.url.encode('utf8')
    print
except SearchError, e:
  print "Search failed: %s" % e

Количество страниц в индексе гугла для домена определим сформировав запрос вида “site:site_url” и поглядев на кол-во результатов :

def GetGoogleIndex(self, url):
    request = 'site:' + url
    index = 0
    try:
        gs = GoogleSearch(request)
        gs.results_per_page = 10
        results = gs.get_results()
        index = gs.num_results
    except SearchError, e:
        index = -1
        print "Search Failed : %s" % e
    finally:
        print "Index: %d\tURL: %s" % (int(index), url)
        return index

С определением PR все непросто, но это не важно, т.к. в интернете несложно найти уже готовый код :
Google PR checker Python code

Результаты можно писать в файлы/базу данных SQL/SQLite, но лучше естественно в базу, проще будет делать выборки. Готовый и отлаженный код без проблем переносится на сервер, при желании реализуется многопоточность, но в этом случае скорее всего придеться дрочить гугл через прокси (код библиотеки открыт, как включить прокси смотреть тут и тут)

My blog is Do-Follow


Пишу код, делаю сайты.
Check out my about.me profile!

парсинг сайтов, форумов, интернет магазинов

Want to subscribe?

istinspring twitter account
istinspring facebook account

 Subscribe in a reader Or, subscribe via email:
Enter your email address:  
Find entries :