Сочинение на тему Исследование по статистике с упором на регрессионный анализ

Опубликовано: 06.09.2020
Предмет: Наука
Темы: математический, Регрессионный анализ

В области статистики регрессионный анализ использует методы моделирования и анализа нескольких переменных, сосредоточив внимание на отношениях между зависимыми и независимыми переменными, помогая аналитику понять, как изменение критерия в одной независимой переменной влияет на критерий других зависимых переменных. , В процессе он определяет средние значения зависимых переменных. Цель – функция регрессии и распределение вероятностей. Широко используемый для прогнозирования и прогнозирования, регрессионный анализ также используется для изучения взаимосвязей. Было разработано несколько методов, включая линейную регрессию, обычную регрессию наименьших квадратов и непараметрическую регрессию. Согласно дорожке D, когда две переменные связаны, предсказание оценки любого человека по одной из переменных из оценки по второй переменной имеет хороший шанс быть точным. Предположение, принятое Лейном, заключалось в том, что отношения между двумя переменными были линейными по природе. «Учитывая, что отношения являются линейными, проблема прогнозирования становится проблемой нахождения прямой линии, которая лучше всего соответствует данным. Поскольку термины «регрессия» и «предсказание» являются синонимами, эта линия называется линией регрессии ». Методы простой регрессии и линейной регрессии были четко объяснены в работах Waner S, который также использовал калькулятор регрессии.

Регрессионный анализ

В области статистики регрессионный анализ относится к методам моделирования, а также к анализу нескольких переменных. В центре внимания анализа всегда находятся отношения, которые существуют между зависимыми и независимыми переменными. Такой анализ помогает исследователю четко понимать способы изменения значений зависимых переменных, когда значения одной или нескольких зависимых переменных колеблются.

Например, методология, используемая при анализе данных исследования сердца, представляет собой «стандартный анализ данных исследования сердца Фрамингема – это обобщенный подход человеко-лет, в котором факторы риска или ковариаты измеряются каждые два года с последующим наблюдением. между этими временами измерения, чтобы наблюдать возникновение таких событий, как сердечно-сосудистые заболевания ». (Источник: Р.Б. Д’Агостино, М. Ли, А.Дж. Белангер, Л.А. Капплз, Статистика – Сколько предметов требуется для проведения регрессионного анализа »- 1990)

Согласно дорожке D, когда две переменные связаны, прогнозирование оценки любого человека по одной из переменных из оценки по второй переменной имеет хороший шанс быть точным. Предположение, принятое Лейном, заключалось в том, что отношения между двумя переменными были линейными по природе. «Учитывая, что отношения являются линейными, проблема прогнозирования становится проблемой нахождения прямой линии, которая лучше всего соответствует данным. Поскольку термины «регрессия» и «прогноз» являются синонимами, эта линия называется линией регрессии ».

При объяснении математического представления линии регрессии, предсказывающей Y из X, является Y ’= bX + A; где X – переменная, представленная на абсциссе (ось X), b – наклон линии, A – точка пересечения Y, а Y ‘состоит из прогнозируемых значений Y для различных значений X. Как показано на иллюстрации, Lane Advances В следующем примере анализируются и представляются взаимосвязи между тестами идентичных блоков, измеряющими пространственную способность, и тестом Wonderlic, измеряющими общий интеллект. Похоже, что отношения в данном случае довольно сильны и составляют 0,677. В процессе он также отображает наиболее подходящую прямую линию с наклоном 0,481 и пересечением Y 15,8468, и для прогнозирования можно использовать линию регрессии. Баллы на графике для Wonderlic – 10, в то время как для идентичного блока – 20. Из формулы для Y ’можно рассчитать, что прогнозируемая оценка равна 0,481 x 10 + 15,86 = 20,67. Вывод, полученный Лейном, следующий: –

«Когда оценки стандартизированы, наклон регрессии (b) равен r Пирсона, а перехват Y равен 0. Это означает, что уравнение регрессии для стандартизированных переменных имеет вид: Y ’= rX». Помимо использования в прогнозировании, линия регрессии также может с пользой описывать взаимосвязь между двумя переменными с наклоном, показывающим изменение критерия единицы и его влияние на переменную предиктора.

Метод простой регрессии и линейной регрессии был четко объяснен Waner S в его «Калькуляторе регрессии». «Введите свои значения для x и y ниже (оставьте третий столбец пустым – это покажет значения, предсказанные регрессионной моделью). Арифметические выражения, такие как 2/3 или 3+ (4 * пи) в порядке. Затем нажмите кнопку (в правом верхнем углу), соответствующую нужному уравнению регрессии. (Например, нажмите кнопку «y = mx + b» для линейной регрессии.) После этого вы можете получить график введенных точек и кривую регрессии, нажав «График».

В примерах, предоставленных Waner, алгоритм написан так, чтобы он округлял вывод до не более одиннадцати значащих цифр. Чтобы обеспечить наиболее подходящую линию или линию регрессии, он приводит пример цены по сравнению с продажами новых домов в течение определенного года, как показано в следующей таблице.

Цена (тысяч долларов) продаж новых домов в этом году

Если упростить ситуацию, заменив каждый из ценовых диапазонов только тем, который находится в середине диапазона, будет получена следующая таблица: Цена (тысяч долларов) Продажи новых домов в этом году

Эти данные можно использовать для построения функции спроса на рынке недвижимости, где спрос равен Y, а продажи представлены X. «Данные определенно предполагают прямую линию, более или менее, и, следовательно, линейную зависимость между р и д. Вот несколько возможных «прямых линий». (Wane S – 2007) Вопрос, который неизменно возникает, заключается в том, какая из них лучше всего подходит линия или линия регрессии на приведенном выше графике. Продажи могут быть спрогнозированы линией наилучшего соответствия или прогнозируемой стоимостью, и она должна быть как можно ближе к фактическим или наблюдаемым значениям. Различия между ними представлены на следующем графике в виде вертикальных линий: Цель анализатора – сделать вертикальное расстояние как можно меньшим, хотя их нельзя установить на ноль. В таком случае прямая линия прошла бы через точки данных. Это не тот случай, здесь. Таким образом, единственно возможная альтернатива – найти линию, которая минимизирует расстояния. Однако все расстояния не могут быть минимизированы, и поэтому решение сводит к минимуму некоторую разумную их комбинацию, такую как их сумма. Еще раз, это будет трудно, так как расстояния измеряются в абсолютных значениях. Следовательно, принятый метод должен принимать сумму квадратов расстояний без какого-либо абсолютного значения.

«Линия, которая минимизирует эту сумму, называется линией наилучшего соответствия, линией регрессии или линией наименьших квадратов, связанной с данными».

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Конец оправдывает средства: насколько верно это утверждение?

28.10.2020 Комментариев нет

Никколо Макиавелли – один из значительных политических и философских мыслителей, известных многим из нас. Макиавелли прежде всего известен фразой «цель оправдывает средства», которая постоянно была

Читать полностью »

Эксперимент и историческое развитие теории

27.10.2020 Комментариев нет

Историческое развитие экспериментов и теории В истории научного развития всегда было некоторое отставание между сбором данных в природе и теориями, которые описывают эти наблюдения. Конечно,

Читать полностью »

Очень счастливый ветер

27.10.2020 Комментариев нет

В этом подкасте два комментатора рассказывают историю сумасшедшего процесса событий, в котором участвовали две девушки по имени Лора Бакстон, воздушный шар, и их дружба, объединенная

Читать полностью »