Блог мнений
мая
17
География IP.
 
                 Статистика определение географических данных посетителя сайта
       является стандартным функционалом любого хостинга.
                 Рассмотрим простейший, но обладающий достаточным уровнем
       контроля, алгоритм автоматизации этого процесса.
                 Что понадобится для его реализации? Умение программировать,
       управление базами данных, выбор подходящего поставщика бесплатной
       географической базы данных.
                 Для чего умение программировать? Придется написать конвертор
       преобразования данных из формата поставщика в формат таблиц базы
       данных.
                 Почему база данных? Потому, что этот вариант обеспечивает
       независимый контроль за развитием системы, начиная с этапа
       первичного накопления информации и до ее профессиональной
       специализации.
                 На начальной стадии (этап организации статистического сбора
       данных о посетителях сайта) достаточно трех таблиц:
                 1 – хранит временно неопределенные географические данные (IP
       неизвестной страны). Выбираем формат хранения IP как
       последовательность, состоящую из четырех групп цифр, разделенных
       точкой; Еще одно поле этой таблицы – счетчик количества посещений с
       этого адреса. Первичный ключ – IP последовательность.
                 2 – хранит справочник географических названий (наименование
       страны). Кроме того, полями таблицы являются: код страны (первичный
       ключ) и счетчик количества посещений из этой страны.
                 3 – IP интервалы, как начало и конец интервала IP,
       преобразованного в целочисленное значение. Каждый интервал связан с
       кодом страны таблицы географических названий. Первичный ключ – два
       поля - код страны и начало интервала. Это необходимо для
       блокирования дублей.
                 Как это работает.
                 Все таблицы пустые. Получаем IP первого посетителя, проверяем, есть ли такой в таблице временно
       неопределенных данных. Если нет, добавляем, если есть, увеличиваем счетчик на 1. Повторяем цикл для любого
       другого посетителя.
                 Просматриваем таблицу временно непроверенных данных и формируем список стран, из которых были обращения,
       используя web сервисы определения адреса по IP. Код страны формируем по собственному усмотрению. Нам нужны
       только те страны, из которых было обращение, поэтому полного справочника стран делать не надо.
                 Обращаемся к поставщику IP интервалов стран (при выборе поставщика следует обратить внимание на точность
       данных, проверить которую можно, например IP Крыма). Конвертируем данные, добавляем в таблицу интервалов,
       переносим счетчик из таблицы временно неопределенных данных в таблицу географических названий, удаляем из
       таблицы временно неопределенных данных обработанный IP адрес.
                 Временные затраты:
                 – создание таблиц – не более 5 минут;
                 – написание и отладка конвертора не более часа;
                 – поиск по IP последовательности страны – не более 1 минуты;
                 – получение текущего справочника интервалов стран – не более 15 минут;
                 – конвертирование интервалов для страны (например, США) – не более 5 минут;
                 – формирование таблицы интервалов для страны (например, США) – не более 5 минут.
                 Кто-то хочет работать над решением описанной проблемы несколько месяцев, да еще за деньги? Ну, в добрый
       путь, … кому интересно.
 

Опубликовано 30 08 2015 в рубрике Информационные технологии

Комментарии

Добавить комментарий

Последние статьи

Вверх Вниз