Содержание к диссертации
Введение
Глава 1 Проблемы становления и развития пищевой промышленности в России 7
1.1 Обзор текущего состояния пищевой промышленности России 7
1.2 Роль экономико-статистических методов в маркетинговых исследованиях рынка 20
1.3 Обзор существующих финансовых инструментов 30
Глава 2. Экономико-статистический анализ рынка продуктов питания .51
2.1 Обзор рынков продуктов быстрого приготовления 51
2.2 Экономико-статистический анализ рынка продуктов питания с помощью многомерной классификации 67
2.3. Влияние ассортимента товаров на формирование прибыли 74
Глава 3 Моделирование и прогнозирование основных показателей, характеризующих эффективность фирмы 77
3.1 Моделирование вероятности покупки продукции компании с использованием логистической регрессии 77
3.2 Основные положения анализа временных рядов и прогнозирования 91
3.3 Анализ динамики и прогнозирование объема реализации товаров основного ассортимента 100
Заключение 112
Список использованной литературы 115
Приложения 123
- Обзор текущего состояния пищевой промышленности России
- Обзор рынков продуктов быстрого приготовления
- Моделирование вероятности покупки продукции компании с использованием логистической регрессии
Введение к работе
Пути дальнейшего развития России во многом связаны с перестройкой экономики и
созданием конкурентоспособного производства. Технический прогресс, наиболее полное удовлетворение потребительского спроса сегодня во многом определяются эффективностью работы предприятий.
Пищевая промышленность России - одна из системообразующих и стратегических отраслей экономики, которая призвана обеспечить население России необходимыми по количеству и качеству продуктами питания. Потребителем продукции данной отрасли является каждый россиянин.
Соотношение спроса и предложения определяет конкурентоспособность товара. Побеждает тот производитель, который сумеет всесторонне проанализировать ситуацию на рынке, разработать стратегические и тактические планы ведения производственной и торговой деятельности, повысить качество продукции при меньших затратах.
Для успешного осуществления предпринимательской деятельности, прежде всего, необходимо иметь информацию о развитии и состоянии как экономической ситуации в стране, регионе, области, так и по отдельно взятому рынку какого-либо товара или услуги. Рынок продуктов питания является частью потребительского рынка, который характеризуется массовым потреблением, разнообразной конкуренцией, децентрализованной структурой. Вообще, рынок сложная многообразная система, которая одновременно формируется под влиянием макро- и микро факторов. С развитием общества развивается и усложняется рыночная система, появляются новые тенденции, которые необходимо тщательно изучать.
Одним из элементов успеха в работе компании на рынке является всестороннее изучение ситуации на рынке в статике и динамике, разработка стратегического и тактического плана ведения производственной или торговой деятельности. Поэтому информационная составляющая успеха предпринимательской деятельности приобретает все большее значение.
В последнее время все чаще применяются многомерные статистические методы, которые позволяют выявить основные закономерности в развитии изучаемых процессов и явлений на основе полученной информации, для принятия обоснованных решений. Проблема практического применения статистических методов анализа заключается в том, что зачастую сложно собрать и привести к необходимому виду первичную информацию, которая имеет непосредственное отношение именно к конкретному предприятию, фирме. Особенно это касается средних и мелких форм предпринимательства, где часто ведется самый примитивный учет информации о функционировании предприятия или не хватает
квалифицированных специалистов в этой области, а управленческие решения принимаются на основе интуиции и опыта руководителя.
Успешному применению и развитию экономико-статистических методов так же способствует появление таких пакетов прикладных программ, как STATISTICA и SPSS, которые предоставляют широкие возможности для анализа и представления в наглядном виде исходной информации и полученных результатов исследования.
Всестороннее изучение рынка относится в первую очередь к задачам маркетинга. С развитием рыночных отношений в России маркетинг находит все более широкое распространение и применение. Постепенно концепция маркетинга проникает в повседневную практику деятельности большинства российских фирм. Внедрение маркетинга в их деятельность сопровождается следующими проблемами:
маркетинг на уровне понимания его как концепции вошел в повседневную жизнь многих фирм, однако из-за отсутствия индивидуального плана маркетинговой стратегии эффект от соответствующих мероприятий часто оказывается ниже ожидаемого;
фирмы изучают зарубежную теорию и практику маркетинга, но приходят к выводу о невозможности его практического использования в силу недостаточности ресурсов (финансовых, трудовых, материальных, информационных);
фирмы формируют маркетинговый отдел, но зачастую, восприняв маркетинг всего лишь как дань моде, а не как стратегическую концепцию, ничего кардинально не меняют в своей деятельности, в результате принятие идей маркетинга лишь формально декларируется, а фактически они не внедряются в бизнес-процесс.
Проблема для России скорее заключается не в необходимости ознакомления с положениями классической теории маркетинга, а в изучении опыта их практического применения зарубежными компаниями, с последующим внедрением в деятельность отечественных фирм и с необходимой адаптацией к условиям российской макро - и микросреды.
Данная работа посвящена изучению рынка продуктов питания. Именно на этом рынке сосредоточено большинство средних и мелких предприятий по производству и реализации продуктов питания. Эти предприятия испытывают наибольшие сложности во внедрении маркетинговой концепции в свою деятельность.
Целью работы является разработка методики комплексного статистического анализа для изучения состояния рынка продуктов питания быстрого приготовления. Для достижения поставленной цели в работе поставлены и решены следующие задачи: 1) Определено место и роль статистических методов в маркетинге;
Дана характеристика состояния пищевой промышленности России и рынка продуктов питания быстрого приготовления;
Выявлены основные закономерности, сложившиеся на рынке продуктов питания России, с помощью многомерных статистических методов;
Исследованы основные тенденции развития рынка;
Изучено влияние ассортимента товаров на формирование прибыли предприятия;
Смоделирована вероятность покупки продукции компании с использованием модели логистической регрессии;
7) Осуществлен прогноз объема реализации товаров основного ассортимента.
Исследование рынка связано, главным образом, с использованием трех подходов поиска
и анализа информации:
анализ вторичной информации;
исследования мотивации и поведения потребителей;
анализа выпускаемой и реализуемой продукции.
Сочетание подходов зависит от возможности получения информации, направления исследования.
В рамках первого подхода изучаются все документы, представляющие интерес для предприятия, изданные статистическими органами, различными министерствами, торговыми палатами, региональными органами управления, а также являющиеся результатом специальных немаркетинговых исследований. Такая информация является достаточно дешевой, относительно легко доступной. Очевидно, что информация может являться закрытой, неполной, недостаточно детализированной, например, не быть представленной в достаточно подробном номенклатурном разрезе. Поэтому для получения надежных результатов ее обычно недостаточно. Анализ такой информации позволяет получить лишь общую картину, например, структуры производства, структуры потребления и т.п.
Второй подход к изучению рынка предполагает исследование мотивации и поведения потребителей путем проведения специальных обследований: интервьюирования, собеседований, заполнения анкет, т.е. здесь применяются как методы социологических исследований, так и экспертные оценки. Здесь возникают проблемы сохранения коммерческой тайны и этического плана, связанные с предоставлением информации о продукции фирм-конкурентов.
Для анализа выпускаемой и реализуемой продукции очень часто применяется АВС-анализ. В продукции фирмы выделяются блоки А, В, С, соответствующие определенным ассортиментом позициям, которые позволяют довести покрытия фиксированных затрат и доходов производителя, соответственно, до 80, 90 и 100%. После того как выявлены эти
группы, проводится политика сокращения блока С, чтобы уменьшить мало производительные затраты и диверсифицировать блок А, уменьшая тем самым опасность оказаться в зависимости от результатов продвижения 1-2 товаров.
В данной работе предлагается альтернатива в виде использования кластерного и логистического регрессионного анализа. Преимуществом кластерного анализа является возможность сгруппировать товарные позиции сразу по нескольким признакам и выявить таким образом закономерности, которые на первый взгляд не видны. Недостатком по сравнению с ABC-анализом можно назвать более сложные вычисления, необходимость интерпретации полученных результатов, а также необходимость использования статистических программ.
В работе использовались такие пакеты прикладных программ, как Statistica, SPSS, Олимп, Excel. Работа состоит из 3 глав, списка используемой литературы, приложений. Содержит 33 таблицы, 25 графиков.
Обзор текущего состояния пищевой промышленности России
Пищевая промышленность России - один из системообразующих элементов российской экономики. Ее стратегическое значение подчеркивают то, что потребитель продукции этой отрасли - каждый из 144 млн. россиян. До 1991 года в АПК производилось 97 % всего потребляемого в стране продовольствия, а население тратило почти 3/4 своих доходов на приобретение продуктов питания. Затем производство отечественных продуктов питания начало резко снижаться, ухудшилось использование производственных мощностей, отечественная продовольственная продукция уступила на рынке место импортной. В целом, доля импортного продовольствия в некоторые годы достигала 60 %, что создавало угрозу продовольственной безопасности страны.
В настоящее время пищевая и перерабатывающая промышленность страны (пищевкусовая, мясная, молочная, рыбная, мукомольно-крупяная и комбикормовая) по-прежнему представляет собой одну из стратегических отраслей экономики, которая призвана обеспечить население России необходимыми по количеству и качеству продуктами питания. Она насчитывает 30 отраслей с более чем 60 подотраслями и видами производства, объединяет более 22 тысяч предприятий различных форм собственности и мощности (их количество за последние 10 лет возросло в несколько раз) общей численностью работающих около 1,4 млн. человек. Их объединяет, прежде всего, единство потребительского назначения производимого специфического продукта - продукта питания, что, в свою очередь, определяет специфические требования к сходному сырью, применяемой технологии, системе машин и всей материально-технической базе и к персоналу. Доля пищевой и перерабатывающей промышленности в общем промышленном производстве России составляет около 15%.
Отрасли пищевой промышленности производят как средства производства -предметы труда (группа "А"), так и предметы потребления (группа "Б"). В товарной продукции этих отраслей на долю группы "А" приходится примерно одна треть, а на долю группы "Б" - две трети. В конечном счете, продукция пищевой промышленности в совокупности - потребительская продукция, пищевой продукт, т.е. продукция группы "Б". Конечно, продукция группы "А" в перерабатывающей промышленности АПК гораздо выше и составляет более 70 %, но она полностью или почти полностью потребляется в самой пищевой промышленности для производства конечного пищевого продукта.
Исходя из выше сказанного, пищевую промышленность можно определить как совокупность отраслей промышленности и отдельных производств, специализированных на выпуск продуктов питания.
Пищевая промышленность - эта часть всей промышленности, объединяющая совокупность однородных пищевых и перерабатывающих предприятий, характеризующаяся единством потребительского назначения производимого конечного продукта пищевого назначения, перерабатывающая, как правило, сырье сельскохозяйственного происхождения и располагающая специфичной материально-технической базой в виде системы машин и аппаратов и соответствующим составом кадров пищевиков.
Кризис 1998 года создал для отечественных производителей новые возможности. Динамика развития пищевой промышленности последние 4 года носит положительный характер.
В данном секторе преобладает смешанная и частная собственность. В ходе приватизации 82% крупных и средних предприятий были преобразованы в открытые акционерные общества, около 12% - в закрытые акционерные общества и товарищества с ограниченной ответственностью. Однако, положение многих предприятий остается тяжелым вследствие недостатка средств для технического переоснащения, низкой покупательной способности населения, обусловливающей неполную загрузку производственных мощностей, отсутствия инвестиций, неудовлетворительного состояния отечественной сырьевой базы и высоких цен на импортное сырье.
Следует отметить, что в последние годы, по данным Госторинспекции, качество отечественных продуктов питания растет, и большинство российских продуктов по качеству превосходит импортные. По этой причине, а также в связи со случаями ввоза и реализации некачественных и фальсифицированных товаров, спрос на импортное продовольствие падает. Кроме того, ряд зарубежных производителей развернул свое производство в России. Государственное регулирование качества продуктов питания осуществляется через стандартизацию и сертификацию. Фонд нормативных документов составляет около 900 межгосударственных и государственных стандартов, до 350 отраслевых и республиканских и более 3500 технических условий. Для развития собственной инициативы товаропроизводителей государство предоставило им право самим разрабатывать и утверждать технические условия на продукцию, что позволяет расширять ассортимент и разнообразить оформление продовольственных товаров. В январе 2000 г. принят закон «О качестве и безопасности пищевых продуктов», который регулирует многие важные аспекты производства продуктов питания.
В группу отраслей с высокой рентабельностью устойчиво входят отрасли, работающие на экспорт и производящие одновременно промежуточный продукт для внутреннего рынка. Это нефтегазовая промышленность и металлургия.
Группу с низкой рентабельностью составляют обрабатывающие отрасли: химия и нефтехимия, машиностроение, лесобумажная, а также пищевая промышленность. Во втором квартале, несмотря на рост доходов, норма прибыли укладывалась здесь в диапазон 7-8%. Тем не менее, высокий рост капитальных вложений зафиксирован практически во всех отраслях промышленности. Пищевики занимают в «рейтинге прироста» третье место -33,5%.
Необходимо отметить, что на результатах работы пищевой промышленности благотворно сказывается даже небольшое повышение благосостояния граждан. Растет потребление и, соответственно, производство. Однако руководители предприятий пищевой промышленности обращают внимание на то, что наметившийся рост покупательной способности населения и увеличивающиеся объемы продаж продовольственных товаров опережают динамику развития сырьевого сектора - сельского хозяйства. При этом высказываются опасения, что очень скоро перерабатывающие отрасли - в первую очередь это касается мясной и молочной промышленности — могут оказаться без отечественного сырья.
В ходе реформ были сделаны попытки создания малых предприятий и цехов малой мощности по переработке сельхозпродукции. За 1991-1998 года было построено более 10 тысяч малых пекарен, около 3 тысяч мясоперерабатывающих и колбасных цехов, около 100 цехов по переработке плодоовощной продукции и более 1300 - по переработке маслосемян. В 1991-1996 годах на строительство цехов малой мощности было затрачено 7845 млрд рублей (в ценах 1995 года), что составило более 21% общего объема капитальных вложений в строительство промышленных предприятий всех отраслей пищевой и перерабатывающей промышленности России.
Обзор рынков продуктов быстрого приготовления
С переходом России к рыночным отношениям, в жизнь россиян вошли новые категории продуктов питания. Сами продукты быстрого приготовления для нашей страны не такая уж редкость. Старшее поколение еще помнит супы харчо и прочие подобные полуфабрикаты, у которых был один большой недостаток (кроме вкусового) - их надо было еще и варить. Победила западная технология, которая предложила свести приготовление пищи к примитивному процессу - просто добавить воды. Согласно американской рыночной терминологии, они были определены как "fast-food" - быстрая еда. Первоначально в эту группу входили четыре категории продуктов:
1. Продукты, не требующие перед употреблением никакого приготовления (чипсы, орешки, печенье, рулеты и другие кондитерские изделия);
2. Продукты, требующие перед употреблением только разогрева (пицца, картофель-фри, готовые охлажденные блюда);
3. Замороженные полуфабрикаты: готовые блюда, требующие незначительного (15-20 мин.) времени для приготовления;
4. Быстро завариваемые крупы, каши и супы.
Появились новые методы изготовления и обработки материалов для упаковки продуктов, исключающие применение традиционных консервантов, заметно ухудшавших качество продуктов и вызывавших негативные последствия. Так же появились принципиально новые технологии обработки некоторых видов продуктов (как растительного, так и животного происхождения), позволяющие создать новый вид продуктов питания. В России принципиально изменился подход к организации всей системы торговли. Децентрализация и переход от государственного регулирования к рыночному, создали новую систему распределения товаров - более гибкую, более эффективную и гораздо более чуткую к повседневным запросам потребителей. Продукты быстрого или, точнее, моментального приготовления производятся по принципиально новой технологии, исключающей процесс варки как таковой. То есть такие продукты не требуют варки, их только необходимо залить кипятком, размешать и в течение нескольких минут продукт будет готов к употреблению. Эти новые виды продуктов питания полностью сохраняют полезные свойства исходного сырья, не требуют специальных условий хранения, приготавливаются в течение очень короткого времени (от 3 до 8 минут). Потребность такого рода продуктов возникает в связи с тем, что складывающиеся условия нашей повседневной жизни требуют минимизации времени на приготовление пищи.
Популярность продуктов быстрого приготовления в России начала расти с приходом в страну международных компаний, таких как Nestle (брэнд Maggi), Unilever (брэнд Knorr), Preparados Alimenticios (брэнд Gallina Blanca). Эти компании впервые стали пропагандировать у нас культуру быстрого питания, столь широко распространенную на Западе. Там потребителями этой категории продуктов считают себя почти 80% населения. Популярны они и среди западных ритейлеров: по оценкам, присутствие на полках супермаркетов продуктов быстрого приготовления в три раза увеличивает товарооборот магазина. В России же продукты быстрого приготовления потребляют в целом в четыре-пять раз меньше, чем на Западе.
Об общедоступности и популярности подобных продуктов говорит и тот факт, что до 80% бульонных кубиков в Москве и около 45% в Санкт-Петербурге реализуются на мелкооптовых рынках. Игнорируют их только люди со средним достатком, которые могут позволить себе перекусить в заведениях «фаст фуд», и те, для кого они являются непозволительной роскошью. Впрочем, кубики у нас довольно быстро перестали считаться едой и перешли в разряд «специй». Более интересные события на рынке растворимой пищи происходят в сегменте супов. По сути, это те же искусственные вкусовые добавки, но уже разбавленные натуральным продуктом - вермишелью. А если говорить об отечественных вариантах, еще и рисом. При этом если разделить супы на те, что требуют дополнительной десятиминутной варки из-за присутствия натуральных ингредиентов, и быстрорастворимые, то последние оказываются вне конкуренции. (Источник: журнал "Эксперт", 31.10.2002)
В начальной стадии (середина 90-х) развития подобного продукта потребителю предлагалась лапша быстрого приготовления импортного производства (Корея, Вьетнам). В последние несколько лет производители освоили производство лапши быстрого приготовления и наладили собственное производство, характерных именно для России, картофельного пюре и каш быстрого приготовления. Таким образом, в настоящее время на рынке продуктов моментального приготовления сложились три ярко выраженные группы продуктов: лапша моментального приготовления,
картофельное пюре моментального приготовления,
каши моментального приготовления.
Вся продукция моментального приготовления предлагается потребителю в двух видах упаковки:
1) Продукция предлагается в упаковке, которую можно использовать в качестве посуды. Это так называемые стаканы из полипропилена. В последнее время появилась упаковка похожая на тарелку и соответственно более удобная и приятная для потребителя. Так же возможно дополнительное приложение ложки или вилки. Преимущество такой упаковки состоит в том, что она дает возможность полноценно поесть при отсутствии элементарных условий приготовления пищи, поэтому удобна для использования на даче, в поездке, на работе.
2) Вторая форма упаковки - пакетик. Такая упаковка уже требует наличия посуды (тарелки или большой кружки), может использоваться непосредственно дома, так же на даче или в офисе, но не применима в «походных условиях».
Первая группа продуктов: различные первые и вторые блюда, в основе которых лежит вермишель быстрого приготовления. Развитие рынка продуктов моментального приготовления началось именно с этой группы, поэтому в этом секторе рынка происходит наиболее сильная конкуренция, которая выливается в многообразие предлагаемой продукции. Борясь за потребителя, производители стараются улучшить дизайн и упаковку, повысить качество. В данной группе присутствуют как традиционные представители, так и множество новинок. Традиционными являются супы и вермишель со вкусом курицы, говядины, бекона и креветок. Новинки — грибы, сыр, овощи, томатный и сливочные соусы. Именно в этой группе присутствует разнообразие упаковки: пакет, стакан, лоток, чашка, наличие ложки. Все это свидетельствует о привлекательности рынка для производителей и, следовательно, высокой их конкуренции, битву за потребителя.
Вторая группа продуктов - картофельное пюре моментального приготовления. Это достаточно новый продукт, находится в стадии роста. Спрос на него динамично развивается. Но рынок ещё окончательно не сформировался. Нет ярко выраженного лидера по производству картофельного пюре. Поэтому на этом рынке также можно отметить ожесточенную борьбу производителей, которые не хотят упустить возможность завоевать значительную долю рынка. Одни стремятся завоевать потребителей за счет повышения качества продукта и разработки специальной рецептуры, другие снижают цену, конечно, в ущерб качеству. Так как этот сектор рынка находится в процессе становления, то можно отметить меньшее разнообразие. Так, картофельное пюре представлено только в стаканах и пакетиках с меньшим разнообразием вкусов. Таким образом, можно предположить, что рынок картофельного пюре будет развиваться и расти, конкурентная борьба будет ещё более ожесточенной.
Третья группа - каши моментального приготовления. Эта группа занимает особое место в продукции моментального приготовления. Во-первых, каши разного рода были всегда традиционным и любимым блюдом в России. Но за последнее время, в связи с тем, что появилось множество новых и разнообразных продуктов питания, каши несколько утратили свое значение в быту российского потребителя. Разнообразные крупы и овсяные хлопья были представлены на российском рынке всегда, но они требуют дополнительной тепловой обработки для приготовления гарнира или завтрака. Потребителю стал необходим продукт, с одной стороны, сохраняющий полезные для здоровья свойства, а с другой - не требующий длительного приготовления. Компании, специализирующиеся на производстве овсяных и других хлопьев, требующих варки, стали предлагать и полностью готовые к употреблению каши. Вместе с тем стали появляться и новые производители подобного продукта. Таким образом, и рынок каш моментального приготовления получил импульс к динамичному развитию, правда, несколько отставая от рынка картофельного пюре. Рынок каш моментального приготовления можно разделить на два подсегмента: каши, потребляемые на завтрак - молочные каши с фруктами и каши потребляемые в качестве второго блюда — каши с курицей, говядиной, грибами.
Моделирование вероятности покупки продукции компании с использованием логистической регрессии
При анализе прогнозировании развития бизнеса предпринимателю часто бывает важно узнать, наступит или нет некоторое событие, и определить переменные, полезные для подобного анализа и прогноза. Почему один бизнес процветает, а другой заканчивается крахом? Ответить на этот и другие вопросы могут помочь многомерные статистические методы: множественный регрессионный и дискриминантный анализ. Однако первый из этих методов не вполне применим, когда отклик (зависимая переменная) может принимать только два значения: наступление или ненаступление определенного события. Второй же обоснован лишь в случае, когда независимые переменные (факторы) совместно нормально распределены.
Если отклик может принимать только два значения, то предположения, необходимые для выполнения проверки гипотез в регрессионном анализе нарушаются, так как ошибки могут не подчиняться нормальному распределению. Более того, поскольку у биномиальной случайной величины с вероятностью "успеха" р дисперсия равняется л]р(\ - р), нельзя говорить даже о постоянстве дисперсии. Другая проблема с множественной линейной регрессией состоит в том, что модельные значения нельзя интерпретировать как вероятности, если они оказываются меньше 0 или больше .
Линейный дискриминантный анализ позволяет оценивать вероятности принадлежности к имеющимся группам, но для оптимальности получаемого решающего правила, требуется выполнение предположений о многомерной нормальности независимых переменных, а также о равенстве ковариационных матриц.
Избежать данных проблем и оценить вероятность наступления события дает возможность логистический регрессионный анализ. Для этого подхода требуются намного более слабые предположения, чем для дискриминантного анализа, причем, даже если условия применимости последнего выполнены, логистическая регрессия дает вполне сравнимые с ним результаты.
Если в линейном регрессионном анализе параметры модели оцениваются с помощью метода наименьших квадратов, т.е. выбираются регрессионные коэффициенты так, чтобы минимизировать сумму квадратов расстояний между наблюденными и предсказанными значениями зависимой переменной, то в логистической регрессии для оценки параметров используется метод максимального правдоподобия. Это значит, что выбираются такие коэффициенты, которые делают наблюденные результаты наиболее "правдоподобными". Поскольку модель логистической регрессии нелинейна, для оценивания параметров применябт итеративный алгоритм.
Так как зависимая переменная может принимать только два значения (наступление или ненаступление события), то в выборке могут иметь место два наблюдения с одинаковыми значениями всех переменных, следовательно, в матрице исходных данных -две одинаковые строки. Для того чтобы избежать переизбытка данных, можно сгруппировать их по значениям независимых переменных. Тогда каждому набору одинаковых значений предикторов будет соответствовать одна строка, а откликом будет встречаемость интересующего нас события; зная общее количество наблюдений, можно получать оценки вероятности. Для сгруппированных данных помимо логистической регрессии также можно использовать пробит-анализ, в основе которого лежит так называемое пробит-преобразование вероятности. Оно состоит в том, что каждая пропорция h заменяется на h-квантиль стандартного нормального распределения, т.е. на решение уравнения N(x0,l)=h. Линейная регрессионная модель строится для преобразованного отклика.
В логистической регрессии, как и в других многомерных статистических методах исследователю необходимо отобрать независимые переменные. Все проблемы, связанные с алгоритмами отбора переменных в регрессионном и дискриминантном анализе, можно найти и в логистической регрессии. Ни один из этих алгоритмов не приводит к "наилучшей" модели в каком бы то ни было статистическом смысле. Различные алгоритмы отбора переменных могут привести к разным моделям. Поэтому на практике имеет смысл построить несколько моделей и выбрать среди них лучшую на основании ее интерпретируемости, экономичности и простоты получения значений переменных.
Как всегда, модель подбирается таким образом, чтобы хорошо описать определенную выборку, так что нет уверенности в том, что та же модель будет выбрана по другой выборке из той же генеральной совокупности. Модель всегда объясняет выборку лучше, чем породившую ее совокупность.
В процедуре Логистическая регрессия имеются несколько методов отбора переменных. Так, можно использовать пошаговые включение (исключение) переменных для автоматизированного построения модели. Для включения переменных в модель всегда используются оценка достигаемого улучшения. Для удаления переменных из модели можно использовать статистику Вальда, изменение в правдоподобии или условную статистику. Все переменные, порождаемые одной и той же дискретной переменной, включаются и исключаются из модели одновременно.
Отбор переменных методом последовательного включения происходит в логистической регрессии так же, как и в множественной линейной регрессии. Первой рассматривается модель, содержащая только свободный член, если использование константы в уравнении не запрещено. На каждом шаге в модель включается переменная с наименьшим уровнем значимости для статистики вклада, при условии, что он меньше заданного порогового значения (по умолчанию 0.05). Затем все переменные, введенные к этому моменту в уравнение, проверяются на необходимость удаления. Если для исключения переменных используется статистика Вальда, она вычисляется для всех переменных, и из модели удаляется переменная с наибольшим р-значением (наблюденным уровнем значимости) для статистики Вальда, при условии, что он превышает заданное пороговое значение (по умолчанию 0,1). Если ни одна переменная не отвечает критерию удаления, в модель включается следующая подходящая переменная.
Если переменная выбирается для удаления, но это приводит к ухудшению качества уже рассмотренной ранее модели, отбор переменных прекращается. В противном случае модель оценивается без удаленной переменной, а остальные переменные снова проверяются на удаление. Это продолжается до тех пор, пока не останется переменных, подходящих для исключения из модели. Затем переменные снова изучаются на предмет включения в модель. Этот процесс продолжается, пока либо не встретится ранее рассмотренная модель (что означает зацикливание алгоритма), либо ни одна из переменных не будет отвечать критериям включения или исключения.
Лучшим, чем статистика Вальда, критерием для определения переменных, которые должны быть удалены из модели, является критерий отношения правдоподобия (ОП). При его применении каждая переменная по очереди исключается из модели, после чего оценивается изменение в логарифмическом правдоподобии. Критерий отношения правдоподобия для проверки нулевой гипотезы о том, что коэффициенты при удаляемых компонентах равны нулю, получается делением правдоподобия для сокращенной модели на правдоподобие для полной модели.
Если нулевая гипотеза верна, а объем выборки достаточно велик, величина, равная удвоенному логарифму статистики отношения правдоподобия, взятому с обратным знаком, подчиняется распределению хи-квадрат с г степенями свободы, где г - это разность между количеством компонент в полной модели и сокращенной модели. Как модельная, так и улучшенная статистика хи-квадрат являются критериями отношения правдоподобия.
Когда критерий отношения правдоподобия используется для исключения компонентов из модели, его уровень значимости сравнивается с пороговым значением. Алгоритм здесь аналогичен ранее описанному, но для удаления переменных используется не статистика Вальда, а статистика отношения правдоподобия.
При исключении переменных из модели можно также использовать условную статистику. Подобно критерию отношения правдоподобия условная статистика основана на разности правдоподобий полной и сокращенной моделей. Однако условная статистика требует значительно менее интенсивных вычислений, поскольку не требует переоценки модели без каждой из переменных.
Для стимулирования эффективного продвижения товара на рынке и анализа региональных предпочтений были исследованы основные факторы, определяющие возможность приобретения потенциальным покупателем продукции фирмы. С этой целью были построены две модели логистической регрессии для результативного показателя у , если покупатель приобрел товар О, в остальных случаях.
Показатели «возраст» и «доход» является количественными переменными; «купон», «образование» и «регион» - номинальные переменные.
В логистической регрессии, как и в линейной, коды для независимых переменных должны выбираться осмысленно, т.е. нельзя взять номинальную переменную типа регион и назначить ей произвольные коды от 1 до 35 и использовать затем получившуюся переменную в модели. В данной ситуации следует перекодировать значения независимой переменной, создав новый набор переменных, связанных определенным образом с исходными категориями.
Если для исследования выбрана двузначная переменная, такая как пол, то каждое ее наблюдение можно закодировать как 0 или 1, чтобы обозначить либо женский, либо мужской пол. Такой тип кодирования называется индикаторным или кодированием фиктивными переменными. Переменные регион, купон и образование являются бинарными переменными. Код 1 во всех случаях обозначает наличие худшего результата и потому интерпретация коэффициентов модели при этих переменных очевидна. Они говорят о разности между логарифмами шансов для случая из "плохой" категории и из "хорошей".
Рассмотрим данные показатели подробнее. Показатели «возраст» и «доход» является непрерывными переменными; «купон», «образование» и «регион» - номинальные переменные.