Цифровизация в металлургии
Metallurgical Cases
Компьютерное зрение, цифровые кейсы в области металлургии
Presented metallurgical digital cases
Эффективность программы лояльности
Loyalty Program Efficiency
Анализ эффективности программы лояльности для автодилера
Analyze the efficiency of the loyalty program
Маркетинговые инвестиции
Marketing Investments
Анализ эффективности каналов и расчет оптимального распределения бюджета между каналами
Analyze effectiveness of the channels and calculate optimal budget allocation between channels
Оптимизация взыскания задолженностей
Debt collection optimization
Применение ML-моделей для увеличения объема собираемой задолженности
Using ML-model to increase Debt Collection
Шопинг-миссии
Shopping Missions
Выявление шопинг-миссий для крупного ритейлера
Optimize planograms and find effective way for targeted advertising test
Голосовой помощник
Voice Bot
Эффективная автоматизированная система общения с клиентами
Automated incident handling lowers costs and improves customer experience by handling more calls at a faster rate.
Эластичность
Price Elasticity
Модель эластичности спроса для CPG производителя
Identify product demand elasticity with respect to price change
HR-Аналитика
HR-Analytics
Ролевая архитектура и сегментация сотрудников для крупной компании
Role-based architecture and employee segmentation for retail company.
Ассортимент и распродажи
Assortment and Markdown
Кластеризация магазинов по структуре спроса и ассортименту для fashion-ритейлера
Identify and describe store clusters based on the demand structure for item in categories over time
Калькулятор маржи
Customer Margin Calc
Инструмент прогнозирования продаж для CPG производителя
Sell-out prediction tool that takes into account different factors and evaluates impact on sales for CPG
Предсказание оттока клиентов
Customer Churn Prediction
Прогнозирование оттока клиентов и анализ основных факторов оттока
Predict customer churn and analyze factors that affect it
Классификатор инцидентов
NLP Incidents Classification
Автоматизированная обработка инцидентов для службы доставки
Automate incidents processing for faster, cheaper and less error-prone service
Автоматизация видеоконтроля ношения масок
Face Mask Detection
Автоматизированный видеоконтроль соблюдения масочного режима
Automated video monitoring of compliance with the mask regime.
Анализ упущенных продаж
Out of Stock Analysis
Анализ недопродаж DIY-ритейлера по магазинам, товарным группам, времени
Analysis of undersales of a DIY retailer by stores, product groups, time
Сегментация товаров
Segmentation
Сегментация как фактор повышения эффективности цепочек поставок.
Segmentation as a factor in improving the efficiency of supply chains.
Система рекомендаций
Recommendation System
Персонализированная система рекомендаций на базе истории покупок
Personalized recommendation system based on purchase history.
Распознавание и классификация аудиосообщений
Speech Recognition
Эффективная автоматизация обработки сообщений
Efficient Message Processing Automation
Анализ отзывов клиентов
Customer Reviews
Анализ и сравнение отзывов о сервисе в магазинах
Analyze stores reviews in different service categories and compare this feedback with main competitors
Геотаргетинг и Георейтинг
Geo Targeting and Geo Ranking
Ранжирование объектов на карте по потенциалу увеличения продаж
Ranking objects on the map according to the potential to increase sales.
Прогнозирование спроса
Forecasting
Построение прогнозов по категориям и магазинам для fashion-ритейлера.
Modeling planning horizons in fashion-retail.
Описание
Эти кейсы демонстрируют, как можно решить различные задачи металлургической промышленности, связанные с автоматизацией: измерение загрязненности руды, прогнозирование основных технологических параметров, влияющих на качество стали, определение фракций сырья, регистрация дефектов, счетчик готовой продукции и т.д.
Обоснование
Автоматизация помогает экономить ресурсы, время, оптимизировать труд людей, а также позволяет улучшить качество готовой продукции.
Данные
Данные телеметрии, критерии оценки брака, факторы производственных процессов, показания датчиков, исторические данные поставщиков лома, кадры из видео и т. д.
Наш подход
В разных кейсах использовались различные подходы, оценка, прогнозирование, автоматизация, компьютерное зрение и классификация.
Результаты
Экономический эффект от внедрения одного цифрового кейса оценивается в среднем в ~15 млн рублей в год. Средний срок окупаемости цифрового кейса составляет около 2 лет.
Case description
These cases solve various metallurgical industry issues related to automatization: measurement of the scrap contamination, forecasting of the main technological parameters affecting the steel's quality, determination of raw material's fraction, defects detection counter and etc.
Case motivation
Automatization reduces resource, time and labor requirements and increases quality.
Data
Telemetry data, scrap evaluation criteria, production processes factors, sensor readings and etc.
Our approach
Different approaches in different cases were used such as valuation, forecasting, automatization, computer vision, classification.
Results
The economic effect from the implementation of one digital case is on average ~15 million rubles per year. The average payback period for a digital case is around 2 years.
Описание
Анализ эффективности программы лояльности на основе интереса пользователей, вовлеченности, использования преимуществ и предоставления данных.
Обоснование
Программа лояльности — важная стратегическая инициатива, влияющая на финансовые показатели компании в долгосрочной перспективе и способная повысить вовлеченность клиентов. Необходимо провести анализ эффективности программы, чтобы сделать ее прибыльной, полезной для компании и привлекательной для клиентов. Программа лояльности также может использоваться для сбора личных данных для лучшего понимания клиентов и их потребностей.
Данные
Данные о действиях участников программы лояльности в хронологическом порядке (начисление и расходование баллов, добавление личной информации о клиентах и т.д.).
Наш подход
Мы проанализировали действия клиентов по различным аспектам — скорость выигрыша призов, количество действий, необходимых для получения приза, интерес к различным призам, предоставление личных данных, демографические показатели и другие.
Результаты
Результаты могут быть использованы для внесения корректив в программу для повышения ее эффективности.
Case description
Analyzing the efficiency of the loyalty program based on user interest, engagement, benefits usage and data provision.
Case motivation
The loyalty program is an important strategic initiative that affects the financial performance of a company in the long term and can increase customer engagement. It is necessary to analyze if the program is efficient to make it profitable and effective for the company and appealing to the customers. The loyalty program can also be used for gathering personal data of clients to better understand them and their needs.
Data
Historical data of actions that participants of the loyalty program took (actions for earning and spending points, etc.), personal information about clients.
Our approach
We analyzed customers actions in various aspects - the speed of earning prizes, the number of actions required to purchase a prize, interest in differnet prizes, sharing personal data, demographics and others.
Results
The results can be used to alternate the program to increase it's efficiency.
Описание
В данном кейсе нашей целью было проанализировать относительную эффективность каналов и рассчитать оптимальное распределение бюджета между каналами. Оптимальное распределение — это одна максимизирующая целевая переменная для заданного бюджетного ограничения при одновременном ограничении инвестиций в другие маркетинговые каналы.
Обоснование
С помощью моделирования маркетингового микса мы получаем возможность оценить каждый медиа-канал по его вкладу в продажу. Мы также можем разработать оптимальную маркетинговую стратегию, которая сократит расходы на маркетинг при максимальном увеличении продаж.
Данные
Мы использовали данные о продажах, макроэкономические факторы, а также данные о каждом используемом канале — ТВ, Digital, Социальные сети и т. д.
Наш подход
Мы преобразуем еженедельные вклады медиа-драйверов в соответствующие годовые кривые эффективности, что подразумевает особое внимание к повторению модели еженедельного роста продаж, количественно определяемой процедурой моделирования, и переносим её на годовой уровень. Годовые кривые эффективности впоследствии используются в качестве входных данных для механизма оптимизации.
Результаты
В результате разработан набор рекомендаций по оптимизации маркетингового бюджета за счет снижения затрат на продвижение и перераспределения бюджета ТВ в Digital канал.
Case description
In this case our goal was to analyze the relative effectiveness of the channels and calculate optimal budget allocation between channels. Optimal allocation is the one maximizing target variable for a given budget constraint while limiting investments in other marketing channels.
Case motivation
We will be able to measure impact of every channel on our sales. We will also be able to rate every channel by its contribution and develop an optimal marketing strategy, which reduces our marketing costs while maximizing sales.
Data
For this case we used sales data as well as data on every marketing channel used – TV, Internet, social media etc.
Our approach
We transform weekly contributions of media drivers to the corresponding annual effectiveness curves, which implies taking special care in repeating the weekly sales uplift pattern, as quantified by the modeling procedure and project that to an annual level. The annual effectiveness curves are subsequently used as an input to optimization engine.
Results
As a result, we developed a set of recommendations to optimize the marketing budget through reducing promotional costs and redistributing the budget of TV into Digital channel.
Описание
Серия кейсов с использованием средств продвинутой аналитики для увеличении вероятности успешного контакта call-центра банка с должниками.
Обоснование
Главный KPI для процессов взыскания – объем собранной задолженности. Повышение этого KPI - основная цель кейсов. Дополнительная задача - оптимизация затрат на процессы сбора задолженности.
Данные
Активное портфолио, платежи клиентов, полные данные по условиям выданных кредитов (сроки, проценты, штрафы и т.д.), триггеры НБКИ (Национальное Бюро Кредитных Историй), полные анкетные данные (все данные, сообщаемые при заявке на кредит и после получения кредита), транзакционные данные по картам, записи разговоров операторов с должниками, данные по времени и длительности звонков, данные по активности в почте, анкетные данные операторов, социально-демографические признаки клиентов.
Наш подход
На первой стадии мы вырабатываем гипотезы и предварительно их прорабатываем с помощью экспертов по взысканию задолженности. Далее мы с руководством банка проводим оценку бизнес-эффекта от внедрения ML-моделей. На следующей стадии проводим анализ качества предоставленных данных и оценку их применимости к выбранным гипотезам. Потом мы переходим к построение моделей и проверке гипотез. На последней стадии проходит А/Б-тестирование ML-моделей и оценка бизнес-эффекта от них.
Результаты
В результате мы получили: увеличение объема сборов задолженностей за счет приоритезации действий и проведения более эффективных коммуникаций, возможность снижения расходов за счёт более эффективного использования собственных ресурсов, возможность более гибко управлять объемом дневного портфеля, своевременная передача должника на соответствующую стадию взыскания и увеличение вероятности дозвона должникам
Case description
A series of cases using advanced analytics to increase the probability of successful contact between the bank's call center and debtors.
Case motivation
The main KPI for collection processes is the amount of debt collected. Increasing this KPI is the main goal of the cases. An additional task is to optimize the costs of debt collection processes.
Data
Active portfolio, customer payments, complete data on the terms of loans issued (terms, interest, penalties, etc.), triggers of the NBCH (National Bureau of Credit History), complete personal data (all data provided when applying for a loan and after receiving a loan ), transaction data on cards, records of operators’ conversations with debtors, data on the time and duration of calls, data on activity in the mail, personal data of operators, socio-demographic characteristics of customers.
Our approach
At the first stage, we develop hypotheses and work them through preliminary with the help of debt collection experts. Next, we, together with the bank's management, evaluate the business effect from the introduction of ML models. At the next stage, we analyze the quality of the data provided and evaluate their applicability to the selected hypotheses. Then we move on to building models and testing hypotheses. At the last stage, A/B-testing of ML-models and an assessment of the business effect from them.
Results
As a result, we received: an increase in the volume of debt collection due to prioritization of actions and more effective communications, the ability to reduce costs due to a more efficient use of our own resources, the ability to more flexibly manage the volume of the daily portfolio, timely transfer of the debtor to the appropriate stage of collection and an increase in the likelihood of dialing debtors.
Описание
Основная цель этого кейса — найти конкретные миссии продуктов. Продуктовые миссии направлены на то, чтобы свести различные типы потребительского поведения к набору целей, каждая из которых имеет свой уникальный выбор продуктов.
Обоснование
Продуктовые миссии позволяют ритейлеру отслеживать корреляции между основными категориями товаров. На базе этой информации можно создавать профили магазинов для различных продуктовых миссий, уточнять детали и этапы клиентоориентированных проектов для более эффективной целевой рекламы. Эта информация также дает представление о том, как оптимизировать планограммы, чтобы увеличить средний размер чека и повысить удовлетворенность клиентов.
Данные
В этом случае мы использовали данные о продажах, иерархии и категориях продуктов, товарных остатках, а также каталоги магазинов.
Наш подход
Во-первых, мы объединили всю информацию о чеках и преобразовали ее в характеристики. Во-вторых, мы использовали алгоритм K-Means для поиска кластеров в векторизованных данных о продажах. Каждый кластер представляет определенную миссию.
Результаты
В итоге мы получили набор миссий, закрепленных за соответствующим чеком. Обобщение этих данных позволяет выявить главные мотивы покупки, уточнить продуктовые наборы для каждой миссии и визуализировать маршруты в магазине, по которым средний покупатель выполняет данную миссию. Эта информация может быть чрезвычайно полезна при оптимизации планограмм.
Case description
The main purpose of this case is to find specific product missions. Product missions aim to boil down different types of consumer behavior into a set of goals, each with its own unique selection of products.
Case motivation
With product missions retailer has the ability to track the correlation effect between core product categories. This information can be used to build store profiles for different product missions, define client projects and their stages for more effective targeted advertising. This information also gives insights on how to optimize planograms in order to increase average check size and customer satisfaction.
Data
In this case we used sales data, hierarchies of products and product categories, shop directories and leftovers data.
Our approach
Firstly, we combined all checks' information and transformed it into features. Secondly, we used K-Means algorithm to find clusters in the vectorized sales data. Each cluster represents a specific mission.
Results
As a result, we got a set of missions assigned to a corresponding check. By aggregating this data, we can find prevalent purchase purposes, define product bundles for each mission and visualize in-store routes an average customer takes to complete this specific mission. This information can be extremely useful in planogram optimization.
Описание
Крупная служба доставки получает множество сообщений от клиентов о проблемах, связанных с доставкой. Голосовой бот помогает перенаправить человеческие ресурсы на более сложные и нестандартные задачи, а типовые, несложные проблемы клиентов решает самостоятельно.
Обоснование
Автоматизированная обработка инцидентов снижает затраты и повышает качество обслуживания клиентов за счет обработки большего количества обращений с большей скоростью.
Данные
Запросы клиентов в текстовом формате в паре с исходным типом инцидента.
Наш подход
Мы автоматизировали преобразование речи в текст, использовали передовые методы обработки разговорного языка (NLP), чтобы отнести тип проблемы к запросу клиента. Затем мы использовали технологию синтеза речи, чтобы в режиме реального времени сообщить клиенту решение. И наконец, мы организовали автоматический перевод звонка от клиента на доступного голосового бота.
Результаты
Комбинация нескольких версий NLP обеспечила точность классификации типов инцидентов на уровне 85%. В зависимости от типа инцидента, пользователи могут услышать запрограммированные, но персонализированные ответы на свои запросы или, в случае нетипичных проблем, автоматически соединиться с оператором колл-центра.
Case description
A major delivery service receives many requests from customers who face issues with delivery. Voice bot helps to reallocate human resources away from easy customer requests to more complicated tasks by resolving typical and simple client questions.
Case motivation
Automated incidents processing reduces costs and increases the service quality by solving customers' problems in a larger volume and at a higher speed.
Data
Customers requests' in text format, paired with initial incident type.
Our approach
We automated speech-to-text conversion, used advanced Natural Language Processing (NLP) techniques to attribute a problem type to customer's request. Than we used text-to-speech synthesis technology to communicate resolution to a customer in a real time. Afterwards, we created automatic call transfer from a customer to the available voice bot.
Results
Combining multiple NLP approaches resulted in 85% incident type classification accuracy. Depending on the type of incident, users can hear scripted but personalized responses to their requests or, in case of atypical issues, redirect the call to a call-center operator.
Описание
Основной целью этих кейсов является определение эластичности спроса на продукт при изменении его цены. Понятие эластичности является характеристикой спроса, которая очень важна для целей ценообразования.
Обоснование
Производители и ритейлеры устанавливают цены на свои товары. Эти цены следует выбирать оптимальным образом, чтобы общий доход компании был наибольшим (при сохранении маржи продукта не ниже определенного уровня). Для этого компания должна учитывать множество факторов, и одним из важнейших является ценовая эластичность. Зная значения этой эластичности, ритейлеры и производители могут устанавливать оптимальные цены.
Данные
В этом кейсе мы используем данные о продажах по каждому продукту, их характеристиках, запасах и иерархии, информацию о продажах конкурентов, историю промо и цен.
Наш подход
Мы используем инструменты эконометрического моделирования для оценки эластичности продаж продукта с учетом различных факторов, которые могут повлиять на продажи.
Результаты
В результате мы получаем коэффициенты эластичности, которые можно использовать для выбора наилучшей цены для каждого товара. Цены, установленные с использованием коэффициентов эластичности, обеспечивают наибольшую выручку от общего объема продаж.
Case description
The main purpose of this case is to identify product demand elasticity with respect to price change. This elasticity is a demand parameter that is useful for pricing targets.
Case motivation
Retailer and consumer goods producers have to set prices for their goods. This prices should be set in an optimal way so that the total revenue for the company will be greatest (having product margin no less than a specific level). To achieve this, company should consider a lot of factors and one of the crucial is a price elasticity. Knowing this elasticity retailer and consumer goods producers are able to set correct prices.
Data
For this case we use sales data for every product, product characteristics, product hierarchy, stock data, competitor's sales, promo history, prices history.
Our approach
We use econometric modelling tools to estimate product sales elasticities with respect to different factors that may influence sales.
Results
As a result we get elasticity coefficients that may be used to choose best price for each product. Prices that were selected using elasticity coefficients provide highest revenue from total sales.
Описание
Была разработана информационная панель, позволяющая проводить аналитику внутри ИТ-функции Компании. Целевая аудитория пользователей — ИТ-менеджеры и HR-специалисты. На вкладке «1.1 Архитектура ролей» для ИТ-менеджеров и HR-специалистов представлена информация о ролевом распределении ИТ-функции. На вкладке «1.2 Аналитика по семействам» пользователь получает информацию о распределении должностей в ИТ-сфере по семействам. На вкладке «1.3 Карьерная сетка» представлена матрица распределения должностей по уровням карьеры с карьерными вариантами при одинаковом наборе фильтров. На вкладке «2. Сегментация группы» пользователи могут анализировать информацию о сегментировании семейства вакансий по критичности для бизнеса и кадровым рискам. На вкладке «3. Сегментация сотрудников» ИТ-руководители и HR-специалисты могут проанализировать информацию о сегментации сотрудников по их важности для бизнеса и производительности труда. На вкладке «4. Горизонтальные переходы» в виде динамического графа отображается прототип горизонтальных переходов.
Обоснование
Мы создали модель с сегментацией ролей и сотрудников, помогающую в систематизации вопросов кадровой политики. Она позволяет проанализировать стратегические приоритеты по укреплению целевой модели управления ИТ-персоналом.
Данные
Для разработки инструмента использовались следующие элементы данных: группы должностей и специализации; карьерные пути и варианты; тип должности (сотрудник, вакансия, фрилансер); карьерные уровни; организационная структура; важность для бизнеса и кадровые риски; результаты сегментации.
Наш подход
Основная цель кейса достигается за счет разработки инструмента, который подразумевает аналитическую панель, созданную в Microsoft Power BI. Информационная панель включает в себя: инструменты визуализации и детализации, фильтры, слайсеры и таблицы, сочетание которых позволяет отображать необходимую информацию.
Результаты
Разработанная информационная панель Power BI дает наглядное представление о распределении ИТ-функций в рамках ролевой модели и карьерной сетки. Инструмент позволяет бизнес-пользователям определять ключевые и критически важные группы должностей и группы сотрудников, а также разрабатывать оптимальную стратегию управления персоналом.
Case description
The case represents a dashboard that provides an analytic inside into IT function of the company. The target user audience includes IT managers and HR methodologists. On the «1.1 Role Architecture» tab, the IT managers and HR methodologists may analyze information about role distribution of IT function. On the «1.2 Family Analytics» tab, the user is provided with information about the distribution of the IT positions by job family. The «1.3 Career grid» tab provides a matrix of the distribution of positions by career levels across career options with the same set of filters. On the «2. Roles segmentation» tab, the users may analyze information about job family segmentation by business criticality and HR risks. On the «3. Employee segmentation» tab, the IT managers and HR methodologists are provided with information about employee segmentation by business criticality and workforce performance. On the «4. Horizontal transitions» tab the prototype of horizontal transitions is depicted in the form of the dynamic graph.
Case motivation
Role model and segmentation of roles and employees were carried out to systemize HR issues and determine strategic priorities to strengthen the target people management model of IT function.
Data
For developing a tool the following data items were used: job families and specializations; career tracks and options; type of position (employee, vacancy, outstaff); career levels; organizational structure; business criticality and HR risks; segmentation outcomes.
Our approach
The main goal of the case is achieved through the development of a tool that implies an analytical dashboard created in Microsoft Power BI. The dashboard includes drill-down visualization tools, filters, slicers and tables that in combination allow depicting the required information.
Results
The developed Power BI dashboard gives a visual representation of the distribution of IT functions within the role model and career grid. The tool allows business users to identify key and critical job groups and employee groups, and develop an optimal HR strategy.
Описание
Цель этого кейса состоит в том, чтобы идентифицировать и описать кластеры магазинов на основе изменения во времени структуры спроса по выбранным категориям товаров. Анализируя эти кластеры, мы можем определить оптимальные моменты проведения распродаж для каждого класса и группы магазинов с учетом сезонности, эластичности спроса и других факторов.
Обоснование
Используя профили спроса, мы можем увеличить прибыль за счет оптимизации ассортимента продукции, маркетинговых стратегий и управления периодами проведения распродаж с учетом конкретных аспектов каждого профиля.
Данные
Для этого кейса мы использовали данные о продажах, атрибуты магазинов и продуктов, а также иерархию продуктов.
Наш подход
Во-первых, мы использовали данные для поиска кластеров продуктов. Во-вторых, для каждого товарного кластера мы выявили оптимальную политику распродаж с учетом сезонности, эластичности спроса и других факторов.
Результаты
В результате мы получили набор пар 'продукт-кластер'. Нанесение этих пар на карту помогает нам визуализировать географическое распределение кластеров и обнаруживать различные закономерности. Мы также определили оптимальную политику распродаж для каждого кластера. Все эти активности призваны помочь оптимизировать ассортимент и план распродаж.
Case description
The purpose of this case was to identify and describe store clusters based on the demand structure for selected item categories over time. By analysing these clusters we can determine best moments for prices markdown for each class and group of stores based on seasonality, demand elasticity and other factors.
Case motivation
Using demand profiles we can increase profit by optimizing our product ranges, marketing strategies and managing markdown price periods taking each profile's specific aspects into consideration.
Data
For this case we used sales data, stores attributes and product attributes information, items hierarchy.
Our approach
Firstly, we used out data to find product clusters. Secondly, for each product cluster we found the best price markdown policy based on seasonality, demand elasticity and other factors.
Results
As a result, we got a set of 'product-cluster' pairs. Mapping these pairs helps us visualize the geographic distribution of clusters and discover different patterns. We also determined the optimal sales policy for each cluster. All these activities are designed to help optimize the assortment and sales plan.
Описание
В данном кейсе нашей целью было разработать инструмент прогнозирования распродаж, учитывающий различные факторы, такие как тип и категория продукта, промо-поддержка, количество дополнительного оборудования и выкладка товара.
Обоснование
В ходе переговоров ритейлеру всегда важно понимать, как спрос на его продукцию зависит от таких факторов как промо-политика и дополнительное оборудование для выкладки. Наш инструмент можно использовать для оценки влияния на продажи входных (независимых) переменных и прогнозирования продаж, в зависимости от изменения этих переменных. После изменения входных данных алгоритм повторно формирует прогнозы, что позволяет нам предсказывать последствия возможных изменений факторов и разрабатывать оптимальную политику продвижения продукта, которая максимизирует показатели продаж.
Данные
Для этого кейса мы использовали данные о продажах, а также данные по нашим входным факторам – размеру скидки, количеству промо-недель в году, количеству промо-выкладок и вторичного оборудования.
Наш подход
Мы обучили две модели линейной регрессии для прогнозирования распродаж на следующий и дальнейшие кварталы.
Результаты
С помощью этого инструмента мы получаем возможность найти как прямое, так и косвенное влияние каждого фактора на каждый продукт и группы продуктов. Изменяя значения факторов, мы можем выстроить оптимальную продуктовую стратегию, чтобы максимизировать продажи.
Case description
In this case, our goal was to develop a sales forecasting tool that takes into account various factors such as product type and category, promotional support, number of additional equipment, and product display.
Case motivation
During negotiations, it is always important for a retailer to understand how the demand for their products depends on factors such as promotional policies and additional display equipment. Our tool can be used to assess the impact on sales of input (independent) variables and forecast sales depending on the change in these variables. After changing the input data, the algorithm re-generates forecasts, which allows us to predict the consequences of possible changes in factors and develop an optimal product promotion policy that maximizes sales.
Data
For this case we used sales data, as well as data for our input factors – discount size, number of promo weeks per year, number of facings and secondary equipment.
Our approach
We trained two linear regression models to forecast sell-outs for following and over the following quarters.
Results
With this tool, we get the opportunity to find both direct and indirect influence of each factor on each product and product group. By changing the values of the factors, we can build the optimal product strategy to maximize sales.
Описание
Выявление клиентов, которые могут уйти, и анализ факторов, связанных с оттоком.
Обоснование
Прогнозирование вероятного оттока клиентов позволяет бизнесу электронной коммерции своевременно принимать дополнительные меры по их удержанию. Это позволяет уменьшить отток клиентов и увеличить их жизненный цикл — а значит, и прибыли, которую клиент приносит за все время работы с ним. Кроме того, выявление и анализ факторов, наиболее существенно влияющих на отток покупателей, позволяет скорректировать политику магазина и повысить уровень удовлетворенности покупателей.
Данные
Информация о клиенте, такая как срок пребывания, сумма кэшбэка, количество заказов и т. д.
Наш подход
На основе предоставленных данных о клиентах мы получили алгоритм прогнозирования оттока. После этого мы выяснили значимость различных факторов для решения модели.
Результаты
Алгоритм предсказывает отток клиента с высокой точностью. Отчет также дает возможность подробно проанализировать факторы, влияющие на отток.
Case description
Identification of customers who may leave and analysis of factors associated with churn.
Case motivation
Predicting likely customer churn allows an e-commerce business to take additional customer retention measures in a timely manner. This allows you to reduce the outflow of customers and increase the life cycle of the client - and hence the profit that the client brings for the entire time of working with him. In addition, identifying and analyzing the factors that most significantly affect the outflow of customers allows you to adjust the policy of the store and increase the level of customer satisfaction.
Data
Customer information, such as tenure, cashback amount, order count, etc.
Our approach
Based on the customer data provided, we trained the churn prediction algorithm. After that, we have access to various solutions for models.
Results
The algorithm predicts customer churn with high accuracy. The report also provides an opportunity to analyze in detail the factors affecting churn.
Описание
Крупная служба доставки получает множество запросов из разных источников от клиентов, столкнувшихся с проблемами при доставке. Эти инциденты обрабатываются вручную, и есть возможность улучшить этот процесс, т.е. автоматически определить тип инцидента, зафиксировать номер телефона клиента и т.д.
Обоснование
В сравнении с автоматической, ручная обработка проблем требует большего времени и чаще подвержена ошибкам, что приводит к неудовлетворенности клиентов. Кроме того, автоматизированная обработка инцидентов обходится дешевле.
Данные
Тексты запросов клиентов и типы исходных инцидентов, помеченные человеком.
Наш подход
Во-первых, мы перемаркировали инциденты, так как корректные данные – залог удовлетворительных результатов, а качество ручной маркировки было невысоким. Мы использовали передовые методы NLP (обработка разговорной речи) для определения типов инцидентов и извлечения полезной информации из запросов.
Результаты
Сочетание нескольких подходов NLP привело к точности классификации типов инцидентов на уровне 91%. На данный момент реализуется надстройка к системе обращений клиентов, которая позволит не только определять тип инцидента, но и извлекать из текста другую необходимую информацию.
Case description
A large delivery service receives a lot of requests from different sources from customers who are experiencing delivery problems. These incidents are handled manually and there is room for improvement in this process, ie. automatically determine the type of incident, capture the customer's phone number, etc.
Case motivation
Compared to automatic, manual problem handling takes longer and is more prone to errors, resulting in customer dissatisfaction. In addition, automated incident handling is cheaper.
Data
Texts of customer requests and types of initial incidents, marked by a person.
Our approach
First, we relabeled the incidents, as correct data is the key to satisfactory results, and the quality of manual labeling was low. We used advanced NLP (Narrative Language Processing) techniques to identify incident types and extract useful information from requests.
Results
The combination of several NLP approaches resulted in an accuracy of 91% for classifying incident types. At the moment, an add-on to the system of customer requests is being implemented, which will allow not only determining the type of incident, but also extracting other necessary information from the text.
Описание
Во время пандемии COVID-19 большая ответственность за контроль ношения масок возлагается на общественные места, например, супермаркеты. Режим определения ношения маски может контролироваться автоматически с помощью установленных в магазине камер и технологии компьютерного зрения.
Обоснование
Программное обеспечение Automated Face Mask Detection позволяет компаниям снять чрезмерную нагрузку с административного персонала, упрощая, удешевляя и повышая точность контроля масочного режима.
Данные
Видео и фотографии людей в масках и без них из открытых источников.
Наш подход
В этом кейсе использовались две сверточные нейронные сети: первая предназначена для селекции лиц из изображений и видео, а вторая — для регистрации наличия или отсутствия медицинской маски.
Результаты
Модель имеет точность более 90% и может быть использована для выявления нарушений масочного режима во время пандемии или в других схожих случаях. Дополнительно был разработан веб-интерфейс для взаимодействия с моделью и просмотра результатов.
Case description
During the COVID-19 pandemic, public places, such as supermarkets, have a greater responsibility for mask-wearing control. The mask wear detection mode can be controlled automatically by store-installed cameras and computer vision technology.
Case motivation
Automated Face Mask Detection software allows companies to take the burden off administrative staff by making mask monitoring easier, cheaper, and more accurate.
Data
Videos and photos of people with and without masks from open sources.
Our approach
In this case, two convolutional neural networks were used: the first is for selecting faces from images and videos, and the second is for registering the presence or absence of a medical mask.
Results
The model has an accuracy of over 90% and can be used to detect violations of the mask regime during a pandemic or in other similar cases. Additionally, a web interface was developed for interacting with the model and viewing the results.
Описание
Анализ упущенных продаж (деньги/количество товара) для крупного ритейлера DIY. Выявление периодов упущенных продаж и их зависимости от времени суток, а также конкретных товаров с наибольшей долей упущенных продаж.
Обоснование
Возможность снизить процент упущенных продаж товаров повышенного спроса за счет выявления проблемных позиций, с дальнейшим выявлением и устранением причин упущенных продаж. Четкое представление хронологических данных - динамика продаж товаров, в зависимости от дневных периодов на тепловой карте продаж. Рекомендации по предметной проверке запасов и инвентаризации. Гибкая возможность настройки KPI. Основа для перехода к расширенному прогнозированию упущенных продаж. Возможности настройки оповещения об упущенных продажах.
Данные
Операции по продажам и товарные остатки за 2 года для двух выбранных магазинов. Список магазинов и перечень ассортимента.
Наш подход
Данные были сгруппированы по разным категориям и наборам, в зависимости от частоты продаж и динамики в течение года. Для определения упущенных продаж и расчета статистики был использован алгоритм прогнозирования скользящего среднего.
Результаты
В результате анализа было установлено, что упущенные продажи составляют 11% от общего объема продаж часто продаваемых товаров. Вывод доказывает эффективность этого анализа и мотивирует дальнейшие исследования в этой области.
Case description
Lost sales analysis (money/quantity) for a large DIY retailer. Identification of periods of lost sales and their dependence on the time of day, as well as specific products with the highest share of lost sales.
Case motivation
The ability to reduce the percentage of lost sales of high-demand goods by identifying problematic positions, with further identification and elimination of the causes of lost sales. Clear presentation of chronological data - the dynamics of sales of goods depending on the daily periods on the heat map of sales. Recommendations for subject inspection of stocks and inventory. Flexible KPI settings. Basis for moving to advanced lost sales forecasting. Possibility to set up notifications about lost sales.
Data
Sales transactions and inventory balances for 2 years for two selected stores. List of stores and list of assortment.
Our approach
The data was grouped into different categories and sets depending on the frequency of sales and dynamics during the year. A moving average forecasting algorithm was used to determine lost sales and calculate statistics.
Results
The analysis found that lost sales accounted for 11% of total sales of frequently sold items. The conclusion proves the effectiveness of this analysis and motivates further research in this area.
Описание
Разделение товаров на сегменты для создания более эффективной цепочки поставок для каждой группы.
Обоснование
Единая стратегия цепочки поставок, подходящая для всех групп товаров, не обладает нужной гибкостью, поэтому желательно разделить продукты на сегменты и применять разные стратегии с учетом их специфики.
Данные
В исследовании использовались: история продаж продуктов, прогнозы продаж и затраты, а также некоторые расчетные характеристики, такие как маржинальность или точность прогнозов.
Наш подход
Влияние признаков рассчитывалось с помощью метода главных компонент. При построении модели сегментации учитывались компоненты, обладающие наибольшим влиянием.
Результаты
В результате для каждого сегмента была разработана конкретная стратегия цепочки поставок, позволяющая максимизировать эффективность и минимизировать затраты.
Case description
Division of goods into segments to create a more efficient supply chain for each group.
Case motivation
A single supply chain strategy suitable for all product groups does not have the necessary flexibility, so it is desirable to divide products into segments and apply different strategies based on their specifics.
Data
The study used: product sales history, sales forecasts and costs, as well as some calculated characteristics, such as marginality or forecast accuracy.
Our approach
The influence of features was calculated using the method of principal components. When building a segmentation model, the components with the greatest influence were taken into account.
Results
As a result, a specific supply chain strategy was developed for each segment to maximize efficiency and minimize costs.
Описание
Персонализация рекомендаций клиентов для их следующих мотиваций к совершению заказов.
Обоснование
Персональные предложения или персональные скидки могут улучшить продажи, поскольку клиенты с большей вероятностью воспримут предложения как привлекательные, что сделает рекламу более эффективной. Кроме того, можно управлять рекомендациями, оценивая стоимость рекомендуемого продукта и потенциальную выгоду, повышая вероятность того, что клиент купит рекомендуемый продукт. Кроме того, персональные рекомендации повышают лояльность клиентов, поскольку клиенты с меньшей вероятностью воспримут их как спам.
Данные
История покупок 200 тыс. покупателей (более 3 млн заказов) крупного продуктового интернет-ритейлера, информация об отделах, выкладке и артикулах.
Наш подход
Анализ данных ритейлеров, далее использование полученной информации для разработки системы рекомендаций, основанной на совместной фильтрации (метод чередующихся наименьших квадратов).
Результаты
Система рекомендаций создает персонализированные предложения для каждого клиента, а также объясняет, почему была сделана каждая рекомендация, и с каким купленным товаром она связана. При этом можно изменить стратегию рекомендации, выбирая между рекомендацией продуктов с наибольшей вероятностью покупки и предложением более дорогих товаров.
Case description
Personalization of customer recommendations for their next ordering motivations.
Case motivation
Personalized offers or personalized discounts can improve sales because customers are more likely to perceive the offers as attractive, making advertising more effective. You can also manage recommendations by evaluating the cost of the recommended product and the potential benefit, increasing the likelihood that a customer will buy the recommended product. In addition, personalized recommendations increase customer loyalty because customers are less likely to perceive them as spam.
Data
Purchase history of 200,000 customers (more than 3 million orders) of a major online grocery retailer, information about departments, display and SKUs.
Our approach
Analysis of retailer data, further use of the obtained information to develop a recommendation system based on collaborative filtering (alternating least squares method).
Results
The recommendation system creates personalized offers for each customer, as well as explains why each recommendation was made and what product it is associated with. In doing so, you can change the recommendation strategy, choosing between recommending products with the highest likelihood of purchase or offering more expensive products.
Описание
Крупная служба доставки получает множество запросов из разных источников от клиентов, столкнувшихся с проблемами при доставке. Производительность службы поддержки может быть повышена за счет автоматизации.
Обоснование
Автоматическая обработка инцидентов дешевле, быстрее и менее подвержена ошибкам, чем ручная обработка.
Данные
Тексты запросов клиентов и первоначальные типы инцидентов, помеченные человеком.
Наш подход
Мы автоматизировали преобразование речи в текст для дальнейшей классификации с помощью инструментов автоматического распознавания речи. Мы использовали передовые методы NLP (обработка разговорной речи) для определения типов инцидентов и извлечения полезной информации из запросов.
Результаты
Сочетание нескольких подходов NLP обеспечило точность классификации типов инцидентов на уровне 91%. Пользователи получают автоматически сформированные ответы, адекватные их запросам.
Case description
A large delivery service receives a lot of requests from different sources from customers who are experiencing delivery problems. Help desk productivity can be improved through automation.
Case motivation
Automatic incident handling is cheaper, faster, and less error-prone than manual incident handling.
Data
Texts of customer requests and initial types of incidents, marked by a person.
Our approach
We have automated speech-to-text conversion for further classification using automatic speech recognition tools. We used advanced NLP (Narrative Language Processing) techniques to identify incident types and extract useful information from requests.
Results
The combination of several NLP approaches provided an accuracy of 91% for classifying incident types. Users receive automatically generated responses that are adequate to their requests.
Описание
Основная цель — проанализировать отзывы о магазинах по различным категориям услуг и на основании этих отзывов провести сравнение с основными конкурентами.
Обоснование
Классифицируя отзывы покупателей, ритейлер может отслеживать динамику рейтинга магазина и анализировать его сильные и слабые стороны в таких категориях как цены, ассортимент, качество и т. д. Кроме того, ритейлер может сравнивать свои магазины с магазинами конкурентов по одинаковым показателям и корректировать стратегии развития.
Данные
Для этого случая мы собрали отзывы клиентов из Google Maps и Yandex Maps. Каждый комментарий был помечен в соответствии с основной темой отзыва клиента – цена, качество товара, качество обслуживания и т. д.
Наш подход
Мы пометили комментарии в соответствии с основным замечанием клиента — цена, качество продукта, качество обслуживания и т. д. Затем мы использовали эти данные для обучения нашего алгоритма классификации — Random Forest – для прогнозирования аналогичных меток рейтинга в новых письменных отзывах.
Результаты
Мы проанализировали динамику рейтинга и выявили конкретные интервалы времени с необычным падением рейтинга. Например, в апреле 2019 года заметно снизился рейтинг ассортимента — с 4,52 до 3,89. Полученные данные стали поводом для более подробного изучения этой проблемы.
Case description
Main purpose of the case is to analyze stores reviews in different service categories and to compare this feedback with main competitors.
Case motivation
By classifying customer feedback, retailer can monitor the dynamics of store ratings and analyse strong and weak store service categories - prices, assortment, quality etc. Moreover, retailer can compare it's stores with competitors' in the same service aspects and to determine development strategies.
Data
For this case we have gathered customer feedback from Google Maps and Yandex Maps. Each comment was labeled according to the main complaint of the customer – price, product quality, service quality etc.
Our approach
We labeled a subset of comments according to the main complaint of the customer – price, product quality, service quality etc. We later used this subset to train our classification algorithm - Random Forest to predict class labels for new written feedbacks.
Results
We analyzed rating dynamics and found specific time periods with unnatural rating fall. For example, in April 2019 there was a big decline in product range rating – from 4.52 to 3.89. This finding was the source for further investigation of this problem.
Описание
Данный кейс ориентирован на создание методики ранжирования отраслевых учреждений, которые в первую очередь будут посещать представители компании для продвижения своего продукта. Цель — выявить вокруг геообъектов ключевые факторы, влияющие на продажи, и оценить эффективность методов, влияющих на продажи. В качестве примера рассматривается фармацевтическая компания.
Обоснование
Знание того, какие геообъекты имеют наибольший потенциал продаж, поможет оптимизировать деятельность фармкомпании, и опосредованно увеличить продажи (за счет увеличения количества врачей, рекомендующих конкретный медикамент).
Данные
В этом случае использовались данные о динамике продаж, характеристиках клиник и аптек (например, количество аптек рядом с клиникой, тип клиники/аптеки) и демографические данные.
Наш подход
Были протестированы различные регрессионные модели, которые включали как характеристики окружения геообъектов (например, расстояние до метро), так и характеристики самих объектов. В представленном случае характеристикой отраслевых учреждений был тип клиники: государственная, частная или дородовая. В другом случае особенностью геообъекта может быть, например, тип магазина: супермаркет, гипермаркет или дискаунтер, а фактором стимулирования покупки – реклама в наиболее эффективных локациях.
Результаты
В результате объединения всех подходов появилось до 180 новых потенциально значимых геообъектов. Кроме того, регрессионный анализ помог выявить факторы, в наибольшей степени влияющие на продажи (например, количество аптек в районе или количество рожденных детей).
Case description
This case is focused on creating a methodology for ranking industry institutions, which will be visited by company representatives in the first place to promote their product. The goal is to identify key factors affecting sales around geo objects and evaluate the effectiveness of methods that affect sales. A pharmaceutical company is considered as an example.
Case motivation
Knowing which geo-objects have the greatest sales potential will help optimize the activities of a pharmaceutical company’, and indirectly increase sales (by increasing the number of doctors recommending a particular drug).
Data
In this case, we used data on sales dynamics, characteristics of clinics’ and pharmacies’ (for example, number of pharmacies near the clinic, type of clinic/pharmacy) and demographic data.
Our approach
Various regression models were tested, which included both the characteristics of the environment of geo objects (for example, the distance to the subway) and the characteristics of the objects themselves. In the case presented, the characteristic of the sectoral institutions was the type of clinic: public, private or antenatal. In another case, a feature of a geo object can be, for example, the type of store: supermarket, hypermarket or discounter, and the purchase incentive factor is advertising in the most effective locations.
Results
As a result of combining all approaches, up to 180 new potentially significant geo-objects appeared. In addition, regression analysis helped to identify the factors that most affect sales (for example, the number of pharmacies in the area or the number of children born).
Описание
Модель прогнозирования спроса для fashion-ритейла по сегментам.
Обоснование
Модель на основе машинного обучения может помочь бизнесу стать более эффективным за счет повышения точности прогнозирования спроса.
Данные
Исторические данные о продажах, иерархия продуктов, стратегический план компании, планы открытия магазинов и прогноз ВВП.
Наш подход
Для PoC были выбраны 4 категории и 2 магазина, чтобы проверить различные подходы и сопоставить возможные результаты с имеющимися данными. Были использованы подходы к моделированию Top-Down и Bottom-Up.
Результаты
В результате была достигнута точность 75-85% для прогнозов категорий и точность 80+% для прогнозов магазинов, что примерно на 10-20% лучше, чем текущий прогноз, основанный на статистике.
Case description
Demand forecasting model for fashion-retail by segments.
Case motivation
ML-based model can improve forecasting accuracy and help the business to improve its efficiency.
Data
Historical sales data, product hierarchy, company strategic plan, stores opening plans and GDP forecast.
Our approach
For PoC, 4 categories and 2 stores were selected to test different approaches and compare possible outcomes with available data. Top-Down and Bottom-Up modeling approaches were used.
Results
As a result, 75-85% accuracy was achieved for category forecasts and 80+% accuracy for store forecasts, which is about 10-20% better than the current forecast based on statistics.
Описание
Основная цель кейса – снижение расхода топлива при производстве пара. Экономия достигается за счет рекомендаций аналитической модели для мониторинга и оптимизации работы котельного оборудования.
Обоснование
Этот кейс помогает клиенту повысить топливную эффективность котельного оборудования за счет улучшенного контроля за работой котлоагрегатов. Дополнительно он помогает оценить качество работы персонала.
Данные
При реализации этого кейса осуществлена интеграция с данными журнала контроля качества топлива и телеметрическими данными STI. Дополнительно были учтены температура и влажность воздуха, а также данные химического анализа топлива.
Наш подход
Мы создали аналитическое решение, производящее оперативный мониторинг работы котельного оборудования, выдачу рекомендаций оператору по корректировке параметров рабочего процесса, одновременно позволяющее оценить качество работы ответственного персонала. Построены ML-модели зависимости положения клапана котла от температуры и влажности воздуха, а также от качества и объема загружаемого угля.
Результаты
Достигнуто увеличение прибыли с 11 до 30 миллионов рублей в год за счет экономии топлива, а также увеличения удельной производительности пара на тонну угля.
Case description
The main purpose of the case is to reduce fuel consumption in the production of steam. Savings are achieved through the recommendations of the analytical model for monitoring and optimizing the operation of boiler equipment.
Case motivation
This case helps the client to improve the fuel efficiency of boiler equipment through improved control over the operation of boiler units. In addition, it helps to evaluate the quality of the work of the staff.
Data
When implementing this case, integration with the data of the fuel quality control log and STI telemetry data was carried out. Additionally, the temperature and humidity of the air, as well as data from the chemical analysis of the fuel, were taken into account.
Our approach
We have created an analytical solution that monitors the operation of boiler equipment, issues recommendations to the operator on adjusting the parameters of the workflow, and at the same time allows us to evaluate the quality of work of responsible personnel. ML-models of dependence of the position of the boiler valve on the temperature and air humidity, as well as on the quality and volume of loaded coal are constructed.
Results
An increase in profit from 11 to 30 million rubles per year was achieved due to fuel savings, as well as an increase in the specific steam productivity per ton of coal.
Описание
Бюджетный анализ направлен на поиск групп клиентов с близкими моделями бюджетных оценок, то есть людей со схожими представлениями об «относительной цене». Это означает, что фактические продукты для бюджетного анализа не так важны. Важно то, были ли эти продукты дорогими или нет, сколько из них было куплено, сколько денег в целом было потрачено и т. д. Анализ бюджета отлично работает с миссиями по покупкам, давая наиболее целостное представление о поведении клиентов.
Обоснование
Выявление сегментов клиентов с разной покупательной способностью дает возможность пересмотреть миссии покупателей и, таким образом, понять различия между покупателями в разных магазинах как с точки зрения мотивации, так и с точки зрения бюджета. Анализ покупательной способности клиентов и покупательских миссий может стать первым шагом к оптимизации ассортимента.
Данные
Чеки (желательно с идентификаторами покупателей), ассортиментная матрица, результаты анализа торговых миссий (по желанию).
Наш подход
Во-первых, цены были сгруппированы по товарным категориям, и для каждой категории путем кластеризации были определены границы «очень низких», «низких», «средних» и «высоких» цен. Затем, после итеративного конструирования признаков и корректировки модели машинного обучения, были выбраны окончательные признаки и модель, и каждый чек был помечен кластером бюджетирования. Затем кластеры бюджетирования были проанализированы, сопоставлены и описаны, в том числе и с точки зрения торговых миссий. Наконец, был создан отчет Power BI для демонстрации результатов.
Результаты
Анализ показывает, что действительно есть несколько общих бюджетных стратегий, которые демонстрируют клиенты, однако доля этих стратегий варьируется, в зависимости от магазина и торговых миссий. Кроме того, отмечены некоторые миссии и бюджетные кластеры, где профили спроса и предложения выглядят не совсем одинаково. Такие случаи указывают на потенциальную, хотя и не гарантированную, возможность оптимизации ассортимента.
Case description
Budget analysis aims to find groups of clients with similar budget estimates, that is, people with similar ideas about relative price. This means that the actual products for the budget analysis are not as important. What matters is whether those products were expensive or not, how many of them were bought, how much money was spent in total, etc. Budget analysis works great with shopping missions, giving the most holistic view of customer behavior.
Case motivation
Identifying customer segments with different purchasing power makes it possible to revisit customer missions and thus understand the differences between customers in different stores, both in terms of motivation and budget. Analyzing the purchasing power of customers and buying missions can be the first step towards optimizing the assortment.
Data
Receipts (preferably with customer identifiers), assortment matrix, results of analysis of trade missions (optional).
Our approach
First, prices were grouped into product categories, and for each category, the boundaries of “very low”, “low”, “medium” and “high” prices were determined by clustering. Then, after iterative feature engineering and adjustment of the machine learning model, the final features and model were selected and each check was labeled with a budgeting cluster. Then the budgeting clusters were analyzed, compared and described, including from the point of view of trade missions. Finally, a Power BI report was created to showcase the results.
Results
The analysis shows that there are indeed several common budget strategies that customers demonstrate, but the proportion of these strategies varies depending on the store and sales missions. In addition, some missions and budget clusters are noted where demand and supply profiles do not look exactly the same. Such cases indicate a potential, although not guaranteed, opportunity for assortment optimization.