Как узнать какой металл в домашних условиях


Как определить металл в домашних условиях?

Как определить металл и его происхождение? Вопрос в основном интересует владельцев драгоценностей, которые боятся приобрести за внушительную сумму подделку. Разобраться с этой проблемой можно самостоятельно или обратиться к эксперту. Ювелир проведет экспертизу, выдаст заключение и возьмет плату за работу. Экспертиза подлинности может стоить от 10 до 20 % от стоимости украшений. Если возможности обратиться к мастеру нет, то стоит попытаться решить проблему собственными силами.

Сравнение платины, серебра и белого золота

Как проверять?

Владельцам украшений из платины стоит помнить:

  1. Платина — дорогой и тяжелый металл, из нее часто изготавливают украшения небольшого размера.
  2. Платину могут заменить серебром, но распознать такую подмену можно по цвету.
  3. Тяжелее всего отличить от оригинала украшение, на которое нанесли слой платины.
  4. Клеймо на поверхности изделия не должно вызывать сомнений.
  5. Платина не боится высоких температур и реагентов.

Стоимость платины постоянно увеличивается, в мире не так много этого металла. Поэтому, если в магазине покупателю предлагают приобрести изделие внушительного размера из платины, при этом его стоимость достаточно низка, стоит отказаться от покупки. Платину дешево не продают, да и украшения из нее делают маленькие, металл слишком тяжелый.

Банковский слиток платины

Серебро и платина похожи внешне, поэтому дорогой металл часто заменяют серебром. Такая подделка выдаст себя черным оттенком и пластичностью. Серебро не устойчиво к повреждениям, на его поверхности останется след, а вот испортить таким образом изделие из платины не получится.

Если на поверхность изделия нанесен слой платины, то распознать подделку можно по весу. Когда такой возможности нет, то без нанесения драгоценности повреждений определить ее качество не получится.

Перед покупкой нужно внимательно рассмотреть клеймо, можно использовать для этого лупу. Если в нем все цифры видны хорошо, скорее всего, украшение действительно изготовлено из платины.

По своим химическим свойствам платина не боится высоких температур и кислот. При погружении в кислоту, аммиак и даже при воздействии йода изделие не изменится. Если попробовать нагреть кольцо или серьгу зажигалкой, то температура украшения изменится не сразу. Платина плохо проводит тепло, в отличие от серебра.

Золото и серебро

В домашних условиях чаще других подвергают проверке золото и серебро. Приобрести подделку можно и в ювелирном магазине, но не стоит паниковать.

Проверить серебро на подлинность просто, достаточно погрузить его в горячую воду. Металл тут же нагреется, но недолго будет держать температуру.

Золотые украшения

Если нанести на поверхность украшения из серебра небольшое количество серной мази, изделие тут же потемнеет. Это будет свидетельствовать о подлинности металла.

Низкопробное серебро отличить проще, достаточно просто подержать вещицу в руках, а потом осмотреть ладони. Если на них остались черные следы или разводы, качество серебра оставляет желать лучшего.

Йод — универсальное средство для проверки драгметаллов, капля его может разрешить все вопросы. Если после проведения процедуры на поверхности украшения остались разводы, — это фальшивка.

Золото также проверяют при помощи йода. Если после теста металл поменял цвет, впитал йод и на его поверхности образовалось пятно, — это признак подделки или сплава, в составе которого присутствует большое количество других, недрагоценных, металлов.

Проверка золота магнитом

Золото можно определить и по цвету: если украшение имеет красный оттенок, то в его составе наверняка присутствует медь. Последняя меняет цвет при высокой влажности, приобретает зеленый оттенок. Поэтому, если золото меняет цвет при контакте с водой, в его составе есть медь в большом количестве. Исключением можно считать красное золото, которое приобретает свой цвет за счет добавления в лигатуру меди.

Чистый листок поможет отличить подделку от золота. Достаточно провести по его поверхности двумя украшениями одновременно. Если полоски не имеют никаких различий, значит, они изготовлены из золота.

Проверять на подлинность стоит только то золото, которое имеет 585 пробу и выше, другие изделия проверку не пройдут. А использование химических элементов во время процедуры сможет испортить украшение.

Отличить позолоту от золота сложно, для этого можно сделать надпил. Повреждение позволит изучить металл на месте спила. Если никаких различий нет, значит, украшение сделано из золота.

Еще одним универсальным методом для проверки драгоценностей считается магнит. Благородные металлы на магнит не реагируют. Если изделие ведет себя иначе, то в его составе есть железо или сталь.

Некоторые умельцы научились отличать серебро от недрагоценных металлов при помощи оценки запаха — эта проверка весьма сомнительна.

Ни один из вышеуказанных способов не даст 100 % гарантии. Можно заподозрить подделку, но точно определить качество металла может только эксперт. На некоторые изделия из серебра вовсе не ставят проб. Это повод задуматься, но подобное явление не свидетельствует о том, что это подделка. Разобраться в подлинности металла и его качестве можно спустя некоторое время. Если через несколько дней после покупки серьги, кольцо или браслет потемнели, это стоит расценивать как первый признак подделки.

Как узнать свою группу крови: домашнее тестирование и многое другое

Мы включаем продукты, которые, по нашему мнению, будут полезны нашим читателям. Если вы покупаете по ссылкам на этой странице, мы можем получить небольшую комиссию. Вот наш процесс.

Определить свою группу крови относительно просто. Вы можете:

  • попросить своего врача назначить анализ
  • получить информацию при сдаче крови
  • сдать анализ крови на дому

Ваша группа крови состоит из двух групп крови: ABO и Rh.

Группы крови основаны на антигенах на поверхности эритроцитов. Антиген - это вещество, которое вызывает иммунный ответ вашего организма против этого вещества.

Наличие специфических антигенов обозначает группы крови ABO:

  • Тип A имеет антиген A
  • Тип B имеет антиген B
  • Тип AB имеет антиген A и B
  • Тип O не имеет ни A, ни B антигена

После определения вашей группы крови ABO ее можно дополнительно определить с помощью определения резус-фактора:

  • резус-положительный. Если у вас есть резус-антигены на поверхности эритроцитов, у вас резус-положительная кровь.
  • резус-отрицательный. Если на поверхности эритроцитов нет резус-антигенов, значит, у вас резус-отрицательная кровь.

Включая резус-фактор, можно определить 8 наиболее распространенных групп крови: A + или A-, B + или B-, AB + или AB-, и O + или O-.

Флеботомист (человек, обученный брать кровь) будет использовать иглу для забора крови из вашей руки в кабинете вашего врача, клинической лаборатории или больнице

Типичный метод типирования крови состоит из двух этапов:

  • прямой набор
  • обратный набор

прямой набор

Первый шаг называется «прямой набор».«Ваши клетки крови смешаны с антителами против крови типа A и B, и образец проверяется, чтобы увидеть, слиплись ли клетки крови (агглютинируют).

Если клетки крови слиплись, это означает, что клетки крови отреагировали с одним из антител.

Например, если ваши кровяные клетки агглютинируют при смешивании с антителами против крови типа B («анти-B-антитела»), у вас кровь типа B.

Обратный набор

Второй шаг называется «обратный набор» или «обратный набор».«Жидкая часть вашей крови без эритроцитов (сыворотка) смешана с клетками крови, которые, как известно, относятся к типу A и типу B.

Люди с кровью типа A имеют антитела против крови типа B (« анти-B антитела » ) в своей сыворотке, а пациенты с кровью типа B имеют в сыворотке антитела против крови типа A («анти-A антитела»).

Кровь типа O содержит как анти-A, так и анти-B антитела.

Так, например, если агглютинация происходит, когда ваша сыворотка смешана с клетками крови типа B, у вас кровь типа A.

Резюме и Rh-тип

ABO-тестирование должно включать как прямой, так и обратный набор текста. Результатом прямого типирования является группа крови пациента. Обратный ввод - это перекрестная проверка для прямого набора и подтверждение результатов.

Затем ваша кровь будет смешана с сывороткой против резус-фактора. Если ваши кровяные клетки реагируют скоплением вместе, у вас резус-положительная кровь.

При тестировании группы крови на дому обычно просят уколоть палец ланцетом и нанести капли крови на специальную карточку.

Нанесив кровь на карту, вы можете наблюдать за областями, в которых кровь собирается или растекается, а затем сопоставить эти реакции с прилагаемым руководством.

В некоторых домашних наборах для тестирования есть флаконы с жидкостью для крови, а не карточки.

Купите здесь набор для определения группы крови на дому.

Один из способов узнать свою группу крови - сдать кровь.

Если вы сдаете кровь в местные учреждения, спросите персонал, смогут ли они сказать вам вашу группу крови.Многие центры пожертвований могут предоставить эту информацию.

Обычно вы не можете сразу определить группу крови и, возможно, придется подождать несколько недель, так как кровь обычно не сразу проверяется.

Около 80 процентов людей секретируют антигены группы крови с другими жидкостями организма, такими как слюна, слизь и пот. Эта группа людей называется секретарями.

Группа секретарей может быть определена с помощью анализа слюны или другой жидкости организма.

Наборы для определения группы крови с использованием слюны доступны в Интернете, но, как правило, они дороже.

Используя один из наборов, вы сначала узнаете, являетесь ли вы секретарем. Если да, то вы сможете определить свою группу крови по системе ABO.

Существует несколько способов определения группы крови, в том числе:

  • посещение врача
  • посещение больницы или клинической лаборатории, где проводится анализ крови
  • сдача крови
  • получение домашнего набора для тестирования

Если вы относитесь к категории людей, которые секретируют антигены группы крови в другие жидкости организма, вы можете узнать свою группу крови, не сдавая кровь.

.

Дома, тесты и многое другое

Мы включаем продукты, которые, по нашему мнению, будут полезны нашим читателям. Если вы покупаете по ссылкам на этой странице, мы можем получить небольшую комиссию. Вот наш процесс.

Знание своей группы крови может помочь человеку лучше понять свое здоровье и получить больше информации о возможных методах лечения.

Каждые 2 секунды кому-то в Соединенных Штатах нужна кровь, но запасы недостаточны из-за COVID-19. Чтобы узнать больше о донорстве крови и о том, как вы можете помочь, посетите наш специализированный центр.

В этой статье мы объясняем, как человек может определить свою группу крови. Мы также изучаем, что такое группа крови, как она возникает и как она может повлиять на переливание крови.

Поделиться на PinterestЛюди, знающие свою группу крови, также могут лучше понимать свое здоровье.

Наличие или отсутствие веществ, называемых антигенами, помогает определить группу крови. Антигены участвуют в запуске иммунного ответа организма.

Человек может иметь антигены A, антигены B, оба или ни один на поверхности эритроцитов.У них также может быть белок, называемый резус-фактором (резус-фактором).

Первый этап определения группы крови включает в себя тест, который называется ABO-типированием. Это позволит определить, какая из следующих четырех основных групп крови у человека:

  1. A: присутствие только антигена A
  2. B: присутствие только антигена B
  3. AB: присутствие обоих антигенов
  4. O : наличие ни одного антигена

Второй этап включает определение наличия (+) или отсутствия (-) резус-фактора в крови человека.

Включая четыре типа ABO и два типа Rh, существует восемь общих групп крови:

  1. A +
  2. A-
  3. B +
  4. B-
  5. AB +
  6. AB-
  7. O +
  8. O-

Человек обычно посещает клинику или кабинет врача, чтобы узнать свою группу крови. Там врач или медсестра берут образец крови и отправляют его в лабораторию для анализа.

Однако есть способы определения группы крови в домашних условиях.

По крови

Человек может определить свою группу крови дома с помощью набора для быстрого определения группы крови.

Для использования набора необходимо, чтобы человек уколол палец иглой. В комплекте идет карточка с химическими веществами, известными как реагенты. Эти тесты на наличие антител и резус-фактора.

Когда в образце крови присутствуют одно или несколько антител к группе крови или резус-фактора, тест дает «слипание» крови. Обычно, если слипания не происходит, у человека группа крови O-отрицательная

Человек может купить домашний набор для тестирования через Интернет.

Без взятия крови

Человек может использовать образец слюны для определения своей группы крови, поскольку некоторые люди производят характерные антигены в своей слюне.

Согласно исследованию 2018 года, если человек секретирует эти антигены со своей слюной, образец высушенной слюны может надежно указать его группу крови.

Однако важно отметить, что не все секретируют эти антигены, и этот метод не обязательно указывает на наличие или отсутствие резус-фактора.

Человек может узнать свою группу крови, сдав кровь.

Некоммерческие организации, такие как Американский Красный Крест, собирают кровь у добровольцев для использования в больницах и в чрезвычайных ситуациях по всему миру.

Участвуя, например, в забеге крови, человек сдаст 1 пинту крови, на полное восполнение которой может уйти 4–6 недель.

Затем человек может получить карту донора, в которой может быть указана его группа крови.

Для сдачи крови человеку не нужно знать свою группу крови.

Группа крови человека передается по наследству от его биологических родителей.

Родитель с кровью типа А может передавать антиген А или не передавать антиген совсем. Если у другого родителя кровь типа B, он может передать антиген B или не передать антиген.В зависимости от комбинации у их ребенка может быть кровь A, B, AB или O.

Если у обоих родителей O крови, у ребенка может быть только O крови.

Резус-фактор наследуется точно так же.

Переливание крови обычно происходит, когда человек пережил травму или операцию, которая привела к сильной кровопотере.

Когда человеку делают переливание крови, чрезвычайно важно сопоставить группу крови донора с группой реципиента.

Причина в том, что в организме вырабатываются антитела против любых антигенов ABO, которые в природе не присутствуют в крови.

Если человек получает кровь от донора с другой группой крови, она будет содержать эти антигены, и организм реципиента отвергнет сданную кровь.

Врач может описать это отторжение как острую иммунную гемолитическую реакцию или острую гемолитическую реакцию при переливании крови.

Эта реакция может быть опасной и даже фатальной. Когда антитела реципиента атакуют клетки крови в результате переливания, клетки открываются, высвобождая в кровоток вещества, которые могут причинить вред.

В результате могут быть повреждены почки, и медицинским работникам необходимо будет немедленно прекратить переливание.

Некоторые симптомы острой гемолитической трансфузионной реакции включают:

  • озноб
  • одышку
  • боль в груди
  • боль в пояснице
  • лихорадку
  • тошноту

Здесь можно узнать больше о переливании крови.

Если кровь человека отрицательная, он универсальный донор.О-отрицательная кровь обычно не вызывает побочных реакций при переливании, поскольку она не содержит ни антигена, ни резус-фактора.

Как отмечает Американское онкологическое общество, если у человека есть:

  • Кровь типа A: Он не может получать эритроциты типа B или AB.
  • Кровь типа B: Они не могут получать эритроциты типа A или AB.
  • Кровь типа AB: Они могут получать эритроциты типа A, B, AB или O.

Хотя человеку не часто требуется знать свою группу крови, эта информация может быть полезной.

Группа крови человека передается по наследству, и ее можно определить несколькими способами, включая посещение кабинета врача или клиники, сдачу крови и использование домашнего набора для тестирования.

.

Что использует мою пропускную способность? 5 советов по мониторингу использования домашней сети

Дети играют в онлайн-игру. Ваш партнер транслирует фильм и загружает что-то для работы. Вы пытаетесь конкурировать с ними за пропускную способность ... но этого просто не происходит.

smartphone-slow-internet

Многие вещи могут истощить вашу пропускную способность в Интернете.В большинстве случаев вы знаете людей в вашей сети. В других случаях это вредоносное ПО или злоумышленник.

Может быть так плохо, что вы кричите: "Что использует мою полосу пропускания ?!" Это хороший вопрос.Вот как вы можете проверить и устранить неполадки, которые (или кто) использует вашу полосу пропускания в вашей домашней сети.

1.Отслеживание использования полосы пропускания через маршрутизатор

Лучшее место для начала выяснения того, что потребляет вашу полосу пропускания, - это ваш маршрутизатор.Ваш маршрутизатор обрабатывает весь входящий и исходящий интернет-трафик для вашего дома.

В настройках вашего маршрутизатора есть страница, содержащая каждое устройство, подключенное к вашей сети в данный момент.Вы можете проверить IP-адреса, MAC-адреса устройств и их текущий статус подключения. В зависимости от вашего маршрутизатора у вас также может быть доступ к сетевой информации, такой как текущая скорость загрузки и выгрузки, а также объем данных, которые использует или использовал каждое устройство.

Например, страница локальной сети на моем маршрутизаторе показывает каждое устройство.

bt smarthub network analysis

Заметили запись, с которой вы не знакомы? Вы можете удалить его и удалить из своей сети.Убедитесь, что не удалили одно из своих устройств в процессе! Если вы это сделаете, это не имеет большого значения. Возможно, вам придется повторно ввести свои учетные данные для входа в сеть, что является незначительным неудобством для большинства устройств.

2.Проверьте использование полосы пропускания с помощью Capsa

Второй вариант проверки того, что использует вашу полосу пропускания, - через стороннюю программу.В этом случае вы можете использовать Capsa, бесплатное приложение для анализа сети, которое фиксирует каждый пакет данных, взаимодействующий с вашей системой.

  1. Выберите сетевой адаптер для вашей системы.Для меня это Ethernet. Для вас это может быть адаптер Wi-Fi. Выберите Full Analysis , затем нажмите Start , чтобы начать работу.
  2. В обозревателе узлов (слева) перейдите к Protocol Explorer> [тип вашего адаптера]> IP . Дерево протоколов расширяется, но на этом можно остановиться.
  3. На панели анализа выберите Протокол На вкладке Протокол показаны пакеты данных для каждого протокола, который использует ваша система.
  4. На панели инструментов анализа в нижней части экрана выберите MAC Endpoint . Если дважды щелкнуть IP-адрес своего устройства, откроется экран подробного анализа пакетов.
capsa select local protocol

Что удобно, так это то, что множество обычного трафика имеет легко идентифицируемые адреса.В других местах Capsa отмечает движение за вас.

Вы также можете организовать эту информацию по-разному.На панели анализа перейдите на вкладку IP Endpoint , затем перейдите к IP-адресу вашего устройства. На панели инструментов анализа отображаются все входящие и исходящие соединения для локального хоста, его географическая конечная точка и многое другое. Столбец Node 2 может быть интересным для чтения!

capsa check ip endpoints

Бесплатная версия имеет некоторые ограничения:

  • Отслеживает только десять частных IP-адресов
  • Только отслеживает один сетевой адаптер
  • Может работать только над одним проектом за раз

Но по большей части эти ограничения не должны влиять на вашу способность выяснить, что ворует вашу полосу пропускания.

Скачать: Capsa для Windows (бесплатно)

Примечание: Хотите отслеживать всю свою сеть? Вот как превратить Raspberry Pi в инструмент сетевого мониторинга.

raspi-network-monitor

3. Сканировать вашу систему на наличие вредоносных программ

Другая возможность заключается в том, что проблемы с пропускной способностью возникают не из вашей локальной сети.Возможно, вы подобрали какое-то неприятное вредоносное ПО, которое крадет вашу полосу пропускания, поскольку оно взаимодействует с внешним сервером или действует как бот для рассылки спама. Вредоносное ПО может потреблять ваше вредоносное ПО множеством способов, хотя оно не всегда является «всепоглощающим». Тем не менее, если у вас есть вредоносное ПО, независимо от потребления полосы пропускания, вам необходимо очистить систему.

У вас должен быть установлен антивирус.Запустите полное сканирование системы любым антивирусом, который вы используете. Кроме того, я настоятельно рекомендую загрузить Malwarebytes и выполнить полное сканирование системы. Поместите в карантин и удалите все гнусные элементы, обнаруженные при полном сканировании системы. Затем проверьте, увеличивается ли ваша пропускная способность. Вы можете заметить резкое увеличение скорости!

Не знаете, с чего начать? Ознакомьтесь с руководством по удалению вредоносных программ MakeUseOf!

4.Используйте Netstat для обнаружения сетевых проблем

Еще один способ отточить системные процессы, занимающие вашу полосу пропускания, - использовать командную строку и команду netstat.Netstat - это сокращение от «сетевой статистики», и вы можете использовать эту команду для оценки всех сетевых входов и выходов в вашей системе (но не в вашем маршрутизаторе).

В строке поиска меню Пуск введите команду , затем щелкните правой кнопкой мыши и выберите Запуск от имени администратора .Когда откроется командная строка, введите netstat -o и нажмите Enter. Далее следует длинный список всех активных сетевых подключений на вашем компьютере, порт, который они прослушивают, внешний адрес и процесс, которому принадлежит сетевое подключение.

command prompt netstat

Просмотрите список и посмотрите, нет ли необычных записей.Вы можете скопировать и вставить адрес в свой браузер, чтобы найти его. Подавляющее большинство записей относится к серверам или облачным серверам того или иного типа, потому что они являются основой Интернета.

Для быстрого анализа перейдите на страницу urlscan.io и вставьте туда адрес. Вы получите краткий отчет о том, кому принадлежит сервер или адрес.

Вы также можете отметить PID (Process ID) .Откройте диспетчер задач, затем вкладку «Службы» и найдите эквивалентный процесс. Если PID имеет много открытых сетевых подключений в командной строке и это услуга, которую вы не узнаете, вы можете либо остановить службу и посмотреть, устраняет ли она проблемы с вашей пропускной способностью, либо выполнить поиск в Интернете, чтобы выяснить, что процесс есть, и если это требуется вашей системе.

windows 10 task manager services pid

5.Проверьте сетевую активность с помощью монитора ресурсов Windows

Находясь в диспетчере задач, чтобы перейти к другому инструменту устранения неполадок с пропускной способностью, щелкните вкладку «Производительность», а затем нажмите кнопку «Монитор ресурсов» внизу.

На мой взгляд, монитор ресурсов - один из самых мощных инструментов, доступных в вашем арсенале устранения неполадок в сети.

Взгляд на столбцы «Отправить» и «Получить» показывает, что на Chrome и Malwarebytes в настоящее время приходится большая часть моей пропускной способности.Видеть Chrome и Malwarebytes вверху списка - это нормально, потому что я доверяю обеим этим программам. Если вы видите неизвестный процесс или приложение вверху списка, истощая вашу пропускную способность, пора начать расследование.

Что использует вашу полосу пропускания?

Это хороший вопрос.Я знаю, что в моем доме иногда может быть до десяти устройств, конкурирующих за пропускную способность. В то время я рад, что могу управлять маршрутизатором.

Не то чтобы я предлагаю сократить пропускную способность вашей семьи или друзей.Однако, если у вас постоянная утечка пропускной способности и вы уверены, что это устройство не находится под вашим контролем, один из приведенных выше советов по мониторингу использования вашей домашней сети обнаружит преступника.

Если вы держите свой смартфон под рукой, почему бы не превратить его в центр анализа мобильной сети с помощью одного из этих приложений для Android?

io14 new features home screen

8 лучших новых функций iOS 14

Об авторе Гэвин Филлипс (Опубликовано 591 статья)

Гэвин - младший редактор отдела Windows and Technology Explained, регулярный участник Really Useful Podcast и редактор дочернего сайта MakeUseOf, посвященного криптографии, Blocks Decoded.У него есть степень бакалавра (с отличием) в области современного письма с использованием методов цифрового искусства, разграбленных на холмах Девона, а также более десяти лет профессионального писательского опыта. Он любит много пить чая, настольные игры и футбол.

Ещё от Gavin Phillips
Подпишитесь на нашу рассылку новостей

Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!

Еще один шаг…!

Подтвердите свой адрес электронной почты в только что отправленном вам электронном письме.

.

способов обнаружения и удаления выбросов | Наташа Шарма

Что вы ищете, работая над проектом Data Science? Что является наиболее важной частью фазы EDA? Есть определенные вещи, которые, если не будут выполнены на этапе EDA, могут повлиять на дальнейшее статистическое моделирование / моделирование машинного обучения. Один из них - поиск «выбросов». В этом посте мы попытаемся понять, что такое выброс? Почему так важно идентифицировать выбросы? Какие есть методы для выбросов? Не волнуйтесь, мы не будем проходить только теоретическую часть, мы также займемся кодированием и построением графиков данных.

Определение Википедии,

В статистике выброс - это точка наблюдения, удаленная от других наблюдений.

Приведенное выше определение предполагает, что выброс - это что-то отдельное / отличное от толпы. Многие мотивационные видео предлагают отличиться от толпы, особенно Малкольма Гладуэлла. Что касается статистики, это тоже хорошо или нет? мы собираемся найти это в этом посте.

Google Image - Wikihow

Видите ли вы что-нибудь по-другому на изображении выше? Все числа в диапазоне 30, кроме числа 3.Это наш выброс, потому что он не где-то рядом с другими числами.

Теперь мы знаем, что такое выброс, но задаетесь ли вы вопросом, как выброс представился населению?

Проект Data Science начинается со сбора данных, и именно тогда выбросы впервые представляются населению. Однако на этапе сбора данных о выбросах вы вообще не узнаете. Выбросы могут быть результатом ошибки во время сбора данных или могут быть просто признаком расхождения в ваших данных.

Давайте посмотрим на несколько примеров. Предположим, вас попросили понаблюдать за выступлениями индийской команды по крикету, т. Е. Пробегом каждого игрока, и собрать данные.

Собранные данные

Как видно из собранных выше данных, все остальные игроки набрали 300+, кроме Игрока 3, который набрал 10. Эта цифра может быть просто ошибкой ввода или дисперсией ваших данных и указанием на то, что Player3 работает очень плохо, поэтому требует улучшений.

Теперь, когда мы знаем, что выбросы могут быть либо ошибкой, либо просто отклонением, как бы вы решили, важны они или нет. Что ж, это довольно просто, если они являются результатом ошибки, тогда мы можем их игнорировать, но если это просто отклонение в данных, нам нужно подумать немного дальше. Прежде чем мы попытаемся понять, игнорировать выбросы или нет, нам необходимо знать способы их выявления.

Большинство из вас может подумать: «О! Я могу просто получить пик данных, чтобы найти выбросы, как мы это делали в ранее упомянутом примере с крикетом.Давайте представим файл с 500+ столбцами и 10k + строками. Вы все еще думаете, что выбросы можно найти вручную? Чтобы облегчить обнаружение выбросов, у нас есть множество методов в статистике, но мы будем обсуждать только некоторые из них. В основном мы будем стараться рассматривать методы визуализации (самые простые), а не математические.

Итак, приступим. Мы будем использовать набор данных Boston House Pricing Dataset, который включен в API набора данных sklearn. Мы загрузим набор данных и разделим функции и цели.

 boston = load_boston () 
x = boston.data
y = boston.target
columns = boston.feature_names # создать фрейм данных
boston_df = pd.DataFrame (boston.data)
boston_df.columns = columns
boston_df.head ()
Boston Housing Data

Характеристики / независимая переменная будет использоваться для поиска любых выбросов. Глядя на данные выше, кажется, что у нас есть только числовые значения, то есть нам не нужно выполнять какое-либо форматирование данных. (Вздох!)

Есть два типа анализа, которым мы будем следовать, чтобы найти выбросы - Uni-variate (анализ выбросов с одной переменной) и многомерный (анализ выбросов с двумя или более переменными).Не запутайтесь, когда вы начнете кодировать и строить график данных, вы сами убедитесь, насколько легко было обнаружить выброс. Для простоты мы начнем с основного метода обнаружения выбросов и постепенно перейдем к более продвинутым методам.

Обнаружение выбросов с помощью инструментов визуализации

Коробчатая диаграмма-

Определение Википедии,

В описательной статистике прямоугольная диаграмма - это метод графического изображения групп числовых данных через их квартили.Коробчатые диаграммы также могут иметь линий, идущих вертикально на из прямоугольников ( усов, ) , указывающих на изменчивость за пределами верхнего и нижнего квартилей, отсюда термины диаграмма прямоугольник и усы и диаграмма прямоугольник и усы. Выбросы могут быть , нанесенными на график как отдельных точек.

Приведенное выше определение предполагает, что если есть выброс, он будет отображаться как точка на прямоугольной диаграмме, а другая совокупность будет сгруппирована вместе и отображаться в виде прямоугольников.Давайте попробуем и увидим сами.

 import seaborn as sns 
sns.boxplot (x = boston_df ['DIS'])
Boxplot - Distance to Employment Center

На графике выше показаны три точки от 10 до 12, это выбросы, поскольку они не включены в рамку другое наблюдение, т. е. не где-то рядом с квартилями.

Здесь мы проанализировали единичный выброс, т.е. мы использовали столбец DIS только для проверки выброса. Но мы также можем проводить многомерный анализ выбросов. Можем ли мы провести многомерный анализ с помощью прямоугольной диаграммы? Что ж, это зависит от того, если у вас есть категориальные значения, вы можете использовать их с любой непрерывной переменной и выполнять многомерный анализ выбросов.Поскольку у нас нет категориальной ценности в нашем наборе данных Boston Housing, нам, возможно, придется забыть об использовании ящичной диаграммы для многомерного анализа выбросов.

Диаграмма рассеяния -

Определение в Википедии

Диаграмма рассеяния - это тип графика или математической диаграммы, использующей декартовы координаты для отображения значений обычно двух переменных для набора данных. Данные отображаются в виде набора из точек , каждая из которых имеет значение , одна переменная , определяющая положение на горизонтальной оси , , и значение , другая переменная , определяющая положение на вертикальной оси , . .

Как следует из определения, диаграмма рассеяния - это набор точек, которые показывают значения двух переменных. Мы можем попытаться построить диаграмму рассеяния для двух переменных из нашего набора данных о жилищном строительстве.

 fig, ax = plt.subplots (figsize = (16,8)) 
ax.scatter (boston_df ['INDUS'], boston_df ['TAX'])
ax.set_xlabel ('Доля акров, не связанных с розничной торговлей на город ')
ax.set_ylabel (' Полная ставка налога на имущество на $ 10 000 ')
plt.show ()
Точечная диаграмма - Доля некоммерческих коммерческих площадей на город по сравнению с полной стоимостью налога на имущество На графике выше мы видим, что большинство точек данных находятся внизу слева, но есть точки, которые находятся далеко от населения, например, в правом верхнем углу.

Обнаружение выбросов с помощью математической функции

Z-Score-

Определение Википедии

Z-score - это стандартное отклонение со знаком, на которое значение наблюдения или точки данных превышает среднее значение того, что наблюдается или измеряется.

Интуиция за Z-оценкой состоит в том, чтобы описать любую точку данных, найдя их связь со стандартным отклонением и средним значением группы точек данных.Z-оценка находит распределение данных, где среднее значение равно 0, а стандартное отклонение равно 1, то есть нормальное распределение.

Вам должно быть интересно, как это помогает в выявлении выбросов? Итак, при вычислении Z-показателя мы повторно масштабируем и центрируем данные и ищем точки данных, которые слишком далеки от нуля. Эти точки данных, которые слишком далеки от нуля, будут рассматриваться как выбросы. В большинстве случаев используется порог 3 или -3, т.е. если значение Z-оценки больше или меньше 3 или -3 соответственно, эта точка данных будет идентифицирована как выбросы.

Мы будем использовать функцию Z-score, определенную в библиотеке scipy, для обнаружения выбросов.

 из scipy import stats 
import numpy as npz = np.abs (stats.zscore (boston_df))
print (z)
Z-score of Boston Housing Data

Глядя на приведенный выше код и выходные данные, трудно сказать какая точка данных является выбросом. Давайте попробуем определить порог для выявления выброса.

 порог = 3 
печать (np.where (z> 3))

Это даст результат, как показано ниже -

Точки данных, где Z-оценка больше 3

Результаты не могут вас смутить.Первый массив содержит список номеров строк, а второй массив номеров соответствующих столбцов, что означает, что z [55] [1] имеют Z-оценку выше 3.

 print (z [55] [1]) 3.375038763517309 

Итак , точка данных - 55-я запись в столбце ZN является выбросом.

Оценка IQR -

График в виде прямоугольников использует метод IQR для отображения данных и выбросов (форма данных), но для того, чтобы получить список идентифицированных выбросов, нам нужно будет использовать математическую формулу и получить выброс данные.

Определение Википедии

Межквартильный диапазон ( IQR ), также называемый средним или средний 50% , или технически H-разброс , является мерой статистической дисперсии, равной разница между 75-м и 25-м процентилями или между верхним и нижним квартилями, IQR = Q 3 - Q 1.

Другими словами, IQR - это первый квартиль, вычитаемый из третьего квартиля; эти квартили можно четко увидеть на прямоугольной диаграмме данных.

Это мера дисперсии, аналогичная стандартному отклонению или дисперсии, но гораздо более устойчивая к выбросам.

IQR в некоторой степени похож на Z-оценку с точки зрения определения распределения данных и последующего сохранения некоторого порога для выявления выброса.

Давайте узнаем, что мы можем использовать коробчатый график с использованием IQR и как мы можем использовать его для поиска списка выбросов, как мы это делали при вычислении Z-показателя. Сначала мы рассчитаем IQR,

 Q1 = boston_df_o1.quantile (0.25) 
Q3 = boston_df_o1.quantile (0,75)
IQR = Q3 - Q1
print (IQR)

Здесь мы получим IQR для каждого столбца.

IQR для каждого столбца

Поскольку теперь у нас есть оценки IQR, пора зафиксировать выбросы. Приведенный ниже код даст результат с некоторыми истинными и ложными значениями. Точка данных, где у нас есть False, означает, что эти значения действительны, тогда как True указывает на наличие выброса.

 print (boston_df_o1 <(Q1 - 1.5 * IQR)) | (boston_df_o1> (Q3 + 1.5 * IQR)) 
Обнаружение выбросов с помощью IQR

Теперь, когда мы знаем, как обнаруживать выбросы, важно понимать, нужны ли они быть удаленным или исправленным.В следующем разделе мы рассмотрим несколько методов удаления выбросов и, при необходимости, подстановки новых значений.

Во время анализа данных, когда вы обнаруживаете выброс, одним из самых сложных решений может быть то, как поступить с выбросом. Должны ли они их удалить или исправить? Прежде чем мы поговорим об этом, мы рассмотрим несколько методов удаления выбросов.

Z-Score

В предыдущем разделе мы видели, как можно обнаружить выбросы, используя Z-оценку, но теперь мы хотим удалить или отфильтровать выбросы и получить чистые данные.Это можно сделать с помощью всего одного строчного кода, поскольку мы уже рассчитали Z-оценку.

 boston_df_o = boston_df_o [(z <3) .all (axis = 1)] 
С и без размера выброса набора данных

Итак, приведенный выше код удалил около 90+ строк из набора данных, т.е. выбросы были удалены.

Оценка IQR -

Так же, как Z-оценка, мы можем использовать ранее рассчитанную оценку IQR, чтобы отфильтровать выбросы, сохраняя только действительные значения.

 boston_df_out = boston_df_o1 [~ ((boston_df_o1 <(Q1 - 1.5 * IQR)) | (boston_df_o1> (Q3 + 1.5 * IQR))). Any (axis = 1)] boston_df_out.shape 

Приведенный выше код удалит выбросы из набора данных.

Существует несколько способов обнаружения и удаления выбросов, но методы, которые мы использовали для этого упражнения, широко используются и просты для понимания.

Следует ли удалять выбросы. Эти мысли могут возникать у каждого аналитика / специалиста по данным хоть раз при каждой проблеме, над которой он работает. Я нашел несколько хороших объяснений -

https: // www.researchgate.net/post/When_is_it_justifiable_to_exclude_outlier_data_points_from_statistical_analyses

https://www.researchgate.net/post/Which_is_the_best_method_for_removing_outliers_in_a_data_set

.

Смотрите также