Блог мнений
мая
17
Статистика посещений сайта.
 
                 Самостоятельно оценив все необходимое для создания
       собственного сайты, Вы, разместив все необходимое на выбранном
       хостинге, наконец-то доходите до этапа оценки статистических данных
       Вашего ресурса. И, «видите картину в духе рафаэлей…».
                 Во-первых, проводя анализ, затрачено определенное время, и
       хотелось бы чтобы оно не пропало зря.
                 Во-вторых, кроме обычных посетителей Вашего ресурса, там
       бывают «роботы».
                 В-третьих, эти «роботы», как минимум, представляют две
       категории: «роботы- поисковики» и «роботы-спама». И, если наличие
       поисковых серверов, просматривающих Ваш сайт еще можно считать
       положительным результатом, то от спама нужна защита.
                 Вот что можно сделать, для того, чтобы Ваши усилия по
       управлению сайтом не пропали.
                 Чтобы не пропало время, затраченное на анализ IP данных,
       очевидно, надо зафиксировать уже просмотренные данные. Ну, а далее,
       смоделировать три кучи IP адресов. Изменения нужно сделать
       на двух уровнях – программном (модули, занимающиеся
       статистикой) и структурном (таблицы базы данных).
                 Структурные изменения.
                 - в таблицу, где фиксируются IP адреса, время посещения и
       страница посещения добавляем два поля: состояние (имеет два
       значения – было проанализировано или нет) и тип IP (пользователь,
       робот, спам, …, можно еще добавлять значения по мере накопления
       знаний). Реализуется это, например, для MySql как, ALTER TABLE ip
       ADD typ INT DEFAULT 0 NOT NULL; и ALTER TABLE ip ADD stat INT
       DEFAULT 0 NOT NULL;
                 - добавляем в базу три тривиальные таблицы, каждая из которых состоит из одного поля, которое является
       первичным коючом. Для MySql это
                 CREATE TABLE IF NOT EXISTS `t_ip_spam` ( `ip_spam` varchar(16) NOT NULL , PRIMARY KEY (`ip_spam`) )
       ENGINE=MyISAM DEFAULT СHARSET=utf8;
                 CREATE TABLE IF NOT EXISTS `t_ ip_robot` ( ` ip_robot` varchar(16) NOT NULL , PRIMARY KEY (`ip_robot`) )
       ENGINE=MyISAM DEFAULT СHARSET=utf8;
                 CREATE TABLE IF NOT EXISTS `t_ ip_user` ( ` ip_user` varchar(16) NOT NULL , PRIMARY KEY (`ip_user`) )
       ENGINE=MyISAM DEFAULT СHARSET=utf8;
                 Три новые таблицы дают группы IP адресов, с помощью которых на уровне операций INNER JOIN можно всегда
       отфильтровать исходную таблицу IP данных (куда добавлялись два поля). Для конкретного сайта, как правило таблицы
       спама и роботов приходят в насыщение (увеличение количества замедляется).
                 Программные изменения касаются модулей, заносящих данные в исходную таблицу IP – для всех новых записей
       значения полей типа и состояния равны 0 – это дает возможность отделять новые записи от тех, которые прошли
       анализ.
                 Новый анализ можно делать в любое время, всегда можно удалить или восстановить в любое время любую
       группировку (тип), даже и вновь появившуюся, например, Вам потребуется учет IP адресов по каждому из поисковых
       серверов – Google, Яндекс, …
 

Опубликовано 19 12 2015 в рубрике Информационные технологии

Комментарии

Добавить комментарий

Последние статьи

Вверх Вниз