π‘†π‘’π‘π‘π‘œπ‘Ÿπ‘‘ π‘‰π‘’π‘π‘‘π‘œπ‘Ÿ π‘€π‘Žπ‘β„Žπ‘–π‘›π‘’π‘ 

π‘ƒπ‘Žπ‘Ÿπ‘‘ βˆ’ 1
1𝐷, 2𝐷, 3𝐷 , 𝑁𝑑
1𝐷 π‘Ž 𝑠𝑖𝑛𝑔𝑙𝑒 π‘π‘œπ‘–π‘›π‘‘ : π‘₯ = 10
2𝐷 π‘Ž 𝐿𝑖𝑛𝑒 π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›: π‘₯ = 10, 𝑦 = 20
3𝐷 π‘Ž π‘ƒπ‘™π‘Žπ‘›π‘’ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›: π‘₯ = 10, 𝑦 = 20, 𝑧 = 30
𝑁𝐷 π»π‘¦π‘π‘’π‘Ÿ π‘π‘™π‘Žπ‘›π‘’ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›: π‘₯, 𝑦, 𝑧, 𝑑…
𝐿𝑖𝑛𝑒 π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›: 𝑦 = π‘€π‘œ + 𝑀1* π‘₯1
π‘ƒπ‘™π‘Žπ‘›π‘’ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›: 𝑦 = π‘€π‘œ + 𝑀1* π‘₯1 + 𝑀2 * π‘₯2
3𝐷 π»π‘¦π‘π‘’π‘Ÿ π‘ƒπ‘™π‘Žπ‘›π‘’ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›: 𝑦 = π‘€π‘œ + 𝑀1* π‘₯1 + 𝑀2 * π‘₯2 + … + 𝑀𝑛 * π‘₯𝑛 𝑛 𝐷
𝐼𝑛 π‘Ÿπ‘’π‘Žπ‘™ π‘‘π‘–π‘šπ‘’ 𝑀𝑒 β„Žπ‘Žπ‘£π‘’ β„Žπ‘¦π‘π‘’π‘Ÿ π‘π‘™π‘Žπ‘›π‘’ 𝑙𝑖𝑛𝑒𝑠
𝑆𝑉𝑀 π‘šπ‘Žπ‘–π‘› π‘Žπ‘–π‘š 𝑖𝑠 𝑖𝑑𝑒𝑛𝑖𝑑𝑓𝑦 π‘‘β„Žπ‘–π‘  β„Žπ‘¦π‘π‘’π‘Ÿπ‘π‘™π‘Žπ‘›π‘’ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›
πΊπ‘’π‘›π‘’π‘Ÿπ‘Žπ‘™π‘™π‘¦ π‘œπ‘’π‘Ÿ π‘šπ‘Žπ‘–π‘› π‘Žπ‘–π‘š 𝑖𝑠 𝑖𝑑𝑒𝑛𝑑𝑖𝑓𝑦 π‘‘β„Žπ‘’ π‘π‘œπ‘’π‘“π‘“π‘–π‘π‘–π‘’π‘›π‘‘π‘  π‘œπ‘Ÿ π‘€π‘’π‘–π‘”β„Žπ‘‘π‘ 
𝑂𝐿𝑆 , 𝐺𝐷
π‘†π‘’π‘šπ‘šπ‘Žπ‘‘π‘–π‘œπ‘› π‘“π‘œπ‘Ÿπ‘šπ‘Žπ‘‘
𝑦 = π‘€π‘œ + 𝑀1* π‘₯1 + 𝑀2* π‘₯2 + … + 𝑀𝑛* π‘₯
𝑛 = π‘€π‘œ + 𝑖 =1
π‘›βˆ‘ 𝑀𝑖 π‘₯, 𝑖
π‘‰π‘’π‘π‘‘π‘œπ‘Ÿ π‘Ÿπ‘’π‘π‘Ÿπ‘’π‘ π‘’π‘›π‘‘π‘Žπ‘‘π‘œπ‘›
𝑦 = π‘€π‘œ + 𝑀1* π‘₯1 + 𝑀2 * π‘₯2 + … + 𝑀𝑛 * π‘₯
𝑛 = π‘€π‘œ + π‘Š * 𝑋
π‘€π‘Žπ‘‘π‘Ÿπ‘–π‘₯ π‘Ÿπ‘’π‘π‘Ÿπ‘’π‘ π‘’π‘›π‘‘π‘Žπ‘‘π‘œπ‘›
𝑦 = π‘€π‘œ + 𝑀1 * π‘₯1 + 𝑀2 * π‘₯2 + … + 𝑀𝑛 * π‘₯
𝑛 = π‘€π‘œ + 𝑀𝑇π‘₯
𝑦 = π‘€π‘œ +𝑖
=1
𝑛,βˆ‘ 𝑀(𝑖, π‘₯, j(π‘ π‘’π‘šπ‘šπ‘Žπ‘‘π‘–π‘œπ‘›)
𝑦 = π‘€π‘œ + π‘Š. 𝑋 ( π‘‰π‘’π‘π‘‘π‘œπ‘Ÿπ‘ )
𝑦 = π‘€π‘œ + π‘Šπ‘‡π‘‹ (π‘€π‘Žπ‘‘π‘Ÿπ‘–π‘₯)

π‘ƒπ‘Žπ‘Ÿπ‘‘ βˆ’ 2: 𝑀𝑒 π‘Žπ‘™π‘Ÿπ‘’π‘Žπ‘‘π‘¦ π‘˜π‘›π‘œπ‘€ π‘‘β„Žπ‘Žπ‘‘ π‘‘π‘–π‘ π‘‘π‘Žπ‘›π‘π‘’ 𝑏𝑒𝑑𝑀𝑒𝑒𝑛 π‘₯1, 𝑦1( ) π‘₯2, 𝑦2( )
π‘€β„Žπ‘Žπ‘‘ 𝑖𝑠 π‘‘β„Žπ‘’ π‘π‘’π‘Ÿπ‘π‘’π‘›π‘‘π‘–π‘π‘’π‘™π‘Žπ‘Ÿ π‘‘π‘–π‘ π‘‘π‘Žπ‘›π‘π‘’ 𝑏𝑒𝑑𝑀𝑒𝑒𝑛 π‘₯
1, 𝑦
1( ) π‘‘π‘œ π‘Žπ‘₯ + 𝑏𝑦 + 𝑐 = 0
𝑑 =π‘Ž π‘₯1+𝑏 𝑦1| +𝑐| π‘Ž2+𝑏2
π‘œπ‘Ÿπ‘–π‘”π‘–π‘›π‘Žπ‘™ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›
= π‘€π‘œ + 𝑀1* π‘₯1 + 𝑀2* π‘₯2 π‘π‘œπ‘–π‘›π‘‘
= (π‘₯1, π‘₯2)
𝑑 =𝑀 1π‘₯ 1+ 𝑀2π‘₯2+π‘€π‘œ| |𝑀1 2+𝑀22
= 𝑀1π‘₯1+𝑀2π‘₯2+π‘€π‘œ| |||π‘Š||
=π‘€π‘œ+π‘Šπ‘‡π‘‹ ||π‘Š||
π‘ƒπ‘Žπ‘Ÿπ‘‘ βˆ’ 3:
π‘Žπ‘  𝑀𝑒 π‘˜π‘›π‘œπ‘€ 𝑓𝑖𝑛𝑑 π‘‘β„Žπ‘’ π‘šπ‘–π‘›π‘–π‘šπ‘’π‘š π‘π‘œπ‘–π‘›π‘‘ π‘Žπ‘›π‘‘ π‘šπ‘Žπ‘₯π‘–π‘šπ‘’π‘š π‘π‘œπ‘–π‘›π‘‘ π‘œπ‘“ π‘Žπ‘› π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›
π‘“π‘œπ‘Ÿ 𝑒π‘₯π‘Žπ‘šπ‘π‘™π‘’ 𝑓𝑖𝑛𝑑 π‘‘β„Žπ‘’ π‘šπ‘–π‘›π‘–π‘šπ‘’π‘š π‘π‘œπ‘–π‘›π‘‘ π‘œπ‘“ 𝑦 = π‘₯
2
𝑀𝑒 π‘˜π‘›π‘œπ‘€ β„Žπ‘œπ‘€ π‘‘π‘œ π‘‘π‘œ
𝑏𝑒𝑑 𝑖𝑓 π‘¦π‘œπ‘’ π‘€π‘Žπ‘›π‘‘ 𝑓𝑖𝑛𝑑 π‘šπ‘–π‘›π‘–π‘šπ‘’π‘š π‘π‘œπ‘–π‘›π‘‘ π‘œπ‘Ÿ π‘šπ‘Žπ‘₯π‘–π‘šπ‘’π‘š π‘œπ‘“ π‘Žπ‘›π‘¦ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘› π‘π‘Žπ‘ π‘’π‘‘ π‘œπ‘› π‘Žπ‘›π‘œπ‘‘β„Žπ‘’π‘Ÿ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›
𝑓(π‘₯, 𝑦) = π‘₯2+ 𝑦2
𝑔(π‘₯, 𝑦) = π‘₯ + 𝑦 βˆ’ 1 = 0
𝑀𝑒 π‘€π‘Žπ‘›π‘‘ π‘‘π‘œ 𝑓𝑖𝑛𝑑 π‘šπ‘Žπ‘₯π‘–π‘šπ‘’π‘š π‘£π‘Žπ‘™π‘’π‘’ π‘œπ‘“ 𝑓(π‘₯, 𝑦) π‘π‘Žπ‘ π‘’π‘‘ π‘œπ‘› π‘π‘œπ‘›π‘ π‘‘π‘Ÿπ‘Žπ‘–π‘› 𝑔(π‘₯, 𝑦)
πΏπ‘’π‘”π‘Ÿπ‘Žπ‘›π‘”π‘’π‘  π‘šπ‘’π‘™π‘‘π‘–π‘π‘™π‘–π‘π‘Žπ‘‘π‘–π‘œπ‘› π‘‘β„Žπ‘’π‘œπ‘Ÿπ‘’π‘š
𝐿(π‘₯, 𝑦, Ξ») = 𝑓(π‘₯, 𝑦) βˆ’ Ξ» * 𝑔(π‘₯, 𝑦)Ξ» = π‘™π‘’π‘”π‘Ÿπ‘Žπ‘›π‘”π‘’π‘  π‘šπ‘’π‘™π‘‘π‘–π‘π‘™π‘–π‘’π‘Ÿ 𝑖𝑛 π‘œπ‘Ÿπ‘‘π‘’π‘Ÿ π‘‘π‘œ 𝑓𝑖𝑛𝑑 π‘₯, 𝑦 π‘£π‘Žπ‘™π‘’π‘’π‘ 
βˆ‚πΏβˆ‚π‘₯ = 0,
βˆ‚πΏβˆ‚π‘¦ = 0,
βˆ‚πΏβˆ‚Ξ» = 0
𝐿(π‘₯, 𝑦, Ξ») = π‘₯2+ 𝑦2 βˆ’ Ξ» * [π‘₯ + 𝑦 βˆ’ 1]
𝐿(π‘₯, 𝑦, Ξ») = π‘₯2+ 𝑦2 βˆ’ Ξ»π‘₯ βˆ’ λ𝑦 + Ξ»
βˆ‚πΏβˆ‚π‘₯ =βˆ‚(π‘₯2+𝑦2βˆ’Ξ»π‘₯βˆ’Ξ»π‘¦+Ξ»)
βˆ‚π‘₯ = 2π‘₯ βˆ’ Ξ»βˆ‚πΏ
βˆ‚π‘¦ =βˆ‚(π‘₯2+𝑦2βˆ’Ξ»π‘₯βˆ’Ξ»π‘¦+Ξ»)
βˆ‚π‘¦ = 2𝑦 βˆ’ Ξ»
βˆ‚πΏβˆ‚Ξ» =βˆ‚(π‘₯2+𝑦2βˆ’Ξ»π‘₯βˆ’Ξ»π‘¦+Ξ»)
βˆ‚Ξ» =βˆ’ π‘₯ βˆ’ 𝑦 + 1
𝑆𝑉𝑀 π‘šπ‘Žπ‘–π‘› π‘”π‘œπ‘Žπ‘™ 𝑖𝑠 𝑓𝑖𝑛𝑑 π‘‘β„Žπ‘’ β„Žπ‘¦π‘π‘’π‘Ÿ π‘π‘™π‘Žπ‘›π‘’ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘› π‘π‘Žπ‘ π‘’π‘‘ π‘œπ‘› π‘‘π‘–π‘“π‘“π‘’π‘Ÿπ‘’π‘›π‘‘ π‘π‘œπ‘–π‘›π‘‘π‘  π‘“π‘Ÿπ‘œπ‘š π‘‘π‘–π‘“π‘“π‘’π‘Ÿπ‘’π‘›π‘‘ π‘π‘™π‘Žπ‘ π‘ π‘’π‘ 
π‘“π‘œπ‘Ÿ 𝑒π‘₯π‘Žπ‘šπ‘π‘™π‘’ π‘‘β„Žπ‘’π‘Ÿπ‘’ π‘‘π‘€π‘œ π‘π‘™π‘Žπ‘ π‘ π‘’π‘  𝑦𝑒𝑠 π‘Žπ‘›π‘‘ π‘π‘œ
𝑀𝑒 π‘€π‘Žπ‘›π‘‘ π‘‘π‘œ π‘ π‘’π‘π‘’π‘Ÿπ‘Žπ‘‘π‘’ π‘‘β„Žπ‘’π‘ π‘’ π‘‘π‘€π‘œ π‘π‘™π‘Žπ‘ π‘ π‘’π‘  π‘π‘œπ‘Ÿπ‘Ÿπ‘’π‘π‘‘π‘™π‘¦
1) π»π‘’π‘Ÿπ‘’ 𝑀𝑒 𝑛𝑒𝑒𝑑 π‘‘π‘œ 𝑓𝑖𝑛𝑑 π‘‘β„Žπ‘’ π»π‘¦π‘π‘’π‘Ÿ π‘π‘™π‘Žπ‘›π‘’ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘› π‘€β„Žπ‘–π‘β„Ž π‘π‘™π‘Žπ‘ π‘ π‘–π‘“π‘¦ π‘π‘œπ‘Ÿπ‘Ÿπ‘’π‘π‘‘π‘™π‘¦ π‘‘π‘€π‘œ π‘π‘™π‘Žπ‘ π‘ π‘’π‘ 
2) π‘‡β„Žπ‘Žπ‘‘ β„Žπ‘¦π‘π‘’π‘Ÿπ‘π‘™π‘Žπ‘›π‘’ π‘ β„Žπ‘œπ‘’π‘™π‘‘ π‘šπ‘Žπ‘–π‘›π‘‘π‘Žπ‘–π‘› π‘Ž π‘šπ‘Žπ‘₯π‘–π‘šπ‘’π‘š π‘‘π‘–π‘ π‘‘π‘Žπ‘›π‘π‘’ π‘“π‘Ÿπ‘œπ‘š π‘π‘œπ‘Ÿπ‘‘π‘’π‘Ÿ π‘π‘œπ‘–π‘›π‘‘
3) π‘‡β„Žπ‘’π‘ π‘’ π‘π‘œπ‘Ÿπ‘‘π‘’π‘Ÿ π‘π‘œπ‘–π‘›π‘‘π‘  π‘Žπ‘Ÿπ‘’ π‘π‘Žπ‘™π‘™π‘’π‘‘ π‘Žπ‘  π‘†π‘’π‘π‘π‘œπ‘Ÿπ‘‘ π‘£π‘’π‘π‘‘π‘œπ‘Ÿπ‘ 
π‘‚π‘’π‘Ÿ π‘šπ‘Žπ‘–π‘› π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘› 𝑖𝑠 𝑦: π‘€π‘œ + 𝑀
𝑇π‘₯π‘€π‘œ + 𝑀𝑇
π‘₯ = 0 π»π‘¦π‘π‘’π‘Ÿ π‘π‘™π‘Žπ‘›π‘’ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›
π‘‡β„Žπ‘–π‘  β„Žπ‘¦π‘π‘’π‘Ÿ π‘π‘™π‘Žπ‘›π‘’ 𝑑𝑖𝑣𝑖𝑑𝑒𝑠 π‘’π‘›π‘‘π‘–π‘Ÿπ‘’ π‘ π‘π‘Žπ‘π‘’ π‘–π‘›π‘‘π‘œ π‘‘π‘€π‘œ π‘π‘Žπ‘Ÿπ‘‘π‘  : π‘π‘™π‘Žπ‘ π‘  βˆ’ 1 π‘Žπ‘›π‘‘ π‘π‘™π‘Žπ‘ π‘  βˆ’ 2
π‘“π‘œπ‘Ÿ 𝑒π‘₯π‘Žπ‘šπ‘π‘™π‘’ π‘₯1 𝑖𝑠 π‘œπ‘›π‘’ π‘π‘œπ‘–π‘›π‘‘ , 𝑖𝑓 π‘¦π‘œπ‘’ π‘€π‘Žπ‘›π‘‘ π‘‘π‘œ π‘˜π‘’π‘’π‘ π‘‘β„Žπ‘–π‘  π‘π‘œπ‘–π‘›π‘‘ 𝑖𝑛 𝑐
1: π‘€π‘œ + 𝑀𝑇π‘₯1 > 0
π‘“π‘œπ‘Ÿ 𝑒π‘₯π‘Žπ‘šπ‘π‘™π‘’ π‘₯1 𝑖𝑠 π‘œπ‘›π‘’ π‘π‘œπ‘–π‘›π‘‘ , 𝑖𝑓 π‘¦π‘œπ‘’ π‘€π‘Žπ‘›π‘‘ π‘‘π‘œ π‘˜π‘’π‘’π‘ π‘‘β„Žπ‘–π‘  π‘π‘œπ‘–π‘›π‘‘ 𝑖𝑛 𝑐2: π‘€π‘œ + 𝑀
𝑇π‘₯1 < 0 π‘“π‘œπ‘Ÿ 𝑒π‘₯π‘Žπ‘šπ‘π‘™π‘’ π‘₯1 𝑖𝑠 π‘œπ‘›π‘’ π‘π‘œπ‘–π‘›π‘‘ , 𝑖𝑓 π‘¦π‘œπ‘’ π‘€π‘Žπ‘›π‘‘ π‘‘π‘œ π‘˜π‘’π‘’π‘ π‘‘β„Žπ‘–π‘  π‘π‘œπ‘–π‘›π‘‘ 𝑖𝑛 𝑐1: π‘€π‘œ + 𝑀𝑇π‘₯1 > 0
π‘“π‘œπ‘Ÿ 𝑒π‘₯π‘Žπ‘šπ‘π‘™π‘’ π‘₯1 𝑖𝑠 π‘œπ‘›π‘’ π‘π‘œπ‘–π‘›π‘‘ , 𝑖𝑓 π‘¦π‘œπ‘’ π‘€π‘Žπ‘›π‘‘ π‘‘π‘œ π‘˜π‘’π‘’π‘ π‘‘β„Žπ‘–π‘  π‘π‘œπ‘–π‘›π‘‘ 𝑖𝑛 𝑐2: π‘€π‘œ + 𝑀𝑇π‘₯1 < 0 π‘“π‘œπ‘Ÿ 𝑒π‘₯π‘Žπ‘šπ‘π‘™π‘’ π‘₯1 𝑖𝑠 π‘œπ‘›π‘’ π‘π‘œπ‘–π‘›π‘‘ , 𝑖𝑓 π‘¦π‘œπ‘’ π‘€π‘Žπ‘›π‘‘ π‘‘π‘œ π‘˜π‘’π‘’π‘ π‘‘β„Žπ‘–π‘  π‘π‘œπ‘–π‘›π‘‘ 𝑖𝑛 𝑐1: π‘€π‘œ + 𝑀𝑇π‘₯1 = 1 π‘“π‘œπ‘Ÿ 𝑒π‘₯π‘Žπ‘šπ‘π‘™π‘’ π‘₯1 𝑖𝑠 π‘œπ‘›π‘’ π‘π‘œπ‘–π‘›π‘‘ , 𝑖𝑓 π‘¦π‘œπ‘’ π‘€π‘Žπ‘›π‘‘ π‘‘π‘œ π‘˜π‘’π‘’π‘ π‘‘β„Žπ‘–π‘  π‘π‘œπ‘–π‘›π‘‘ 𝑖𝑛 𝑐2: π‘€π‘œ + 𝑀𝑇π‘₯1 =βˆ’ 1 π‘€π‘œ + 𝑀𝑇π‘₯1 = 0 ( π‘‘β„Žπ‘–π‘  𝑀𝑒 π‘€π‘Žπ‘›π‘‘) π‘€π‘œ + 𝑀𝑇π‘₯1 = 1π‘€π‘œ + 𝑀𝑇 π‘₯1 =βˆ’ 1𝑦 * π‘€π‘œ + 𝑀𝑇π‘₯ ( 1) > 1𝑦 = 𝑦𝑒𝑠 (+ 1) 𝑦 = π‘›π‘œ (βˆ’ 1)𝑦 = 1 ====== > π‘€π‘œ + 𝑀𝑇π‘₯ ( 1) > 1 (π‘π‘™π‘Žπ‘ π‘  βˆ’ 1)𝑦 =βˆ’ 1 ====== > π‘€π‘œ + 𝑀𝑇π‘₯ ( 1) < 1 :
(π‘π‘™π‘Žπ‘ π‘  βˆ’ 2)
𝑦 * π‘€π‘œ + 𝑀𝑇π‘₯ ( 1)β‰₯1
π‘”π‘œπ‘Žπ‘™ β„Žπ‘’π‘Ÿπ‘’ 𝑖𝑠 𝑓𝑖𝑛𝑑 π‘œπ‘’π‘‘ π‘‘β„Žπ‘’ π‘‘π‘Žπ‘‘π‘Ž π‘π‘œπ‘–π‘›π‘‘π‘ , π‘€β„Žπ‘–π‘β„Ž π‘Žπ‘Ÿπ‘’ π‘ π‘Žπ‘‘π‘–π‘’π‘ π‘“π‘–π‘’π‘  π‘€π‘œ + 𝑀𝑇π‘₯1 = 1π‘€π‘œ + 𝑀𝑇π‘₯1 =βˆ’ 1
Objective of SVM: SVM aims to find the hyperplane that maximizes the margin, making the classifier
as robust as possible.
π‘”π‘œπ‘Žπ‘™ : 𝑓𝑖𝑛𝑑 π‘‘β„Žπ‘’ π‘‘π‘–π‘ π‘‘π‘Žπ‘›π‘π‘’ 𝑏𝑒𝑑𝑀𝑒𝑒𝑛 π‘‘π‘Žπ‘‘π‘Ž π‘π‘œπ‘–π‘›π‘‘ π‘‘π‘œ π‘‘β„Žπ‘’ β„Žπ‘¦π‘π‘’π‘Ÿπ‘π‘™π‘Žπ‘›π‘’ π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘›
π‘šπ‘Žπ‘˜π‘’ π‘ π‘’π‘Ÿπ‘’ π‘‘β„Žπ‘’ π‘‘π‘–π‘ π‘‘π‘Žπ‘›π‘π‘’ π‘ β„Žπ‘œπ‘’π‘™π‘‘ 𝑏𝑒 π‘šπ‘Žπ‘₯π‘–π‘šπ‘’π‘š
Support Vectors:
● Definition: Support vectors are the data points that lie closest to the decision boundary
(hyperplane). These points are the most challenging to classify correctly and are the key
points that define the position and orientation of the hyperplane.
Importance:
● The support vectors are critical because they are the points that “support” the optimal
hyperplane. In fact, the SVM model is entirely defined by these support vectors. The position
of all other data points is irrelevant as long as they are correctly classified by the hyperplane.
● If you remove a support vector from the dataset, the hyperplane could shift, potentially
changing the classification of some other points. However, removing a non-support vector
point will not affect the hyperplane.

  1. Margin Maximization:
    ● Definition: The margin is the distance between the hyperplane and the nearest data points
    from any class (i.e., the support vectors). In a binary classification problem, there will be a
    margin on either side of the hyperplane.
    ● Objective of SVM: SVM aims to find the hyperplane that maximizes this margin, making the
    classifier as robust as possible.
    ● Why Maximize the Margin?:
    o Generalization: A larger margin implies that the model has more confidence in its
    classification decisions. It reduces the risk of overfitting because the model is less
    sensitive to slight variations in the data points.
    o Robustness: A wider margin means the model is better at generalizing to unseen
    data. If new data points are added, they are more likely to be classified correctly if
    the margin is large.
  2. Mathematical Perspective
    π·π‘–π‘ π‘‘π‘Žπ‘›π‘π‘’ 𝑏𝑒𝑑𝑀𝑒𝑒𝑛 π‘ π‘’π‘π‘π‘œπ‘Ÿπ‘‘ π‘£π‘’π‘π‘‘π‘œπ‘Ÿ π‘‘π‘Žπ‘‘π‘Žπ‘π‘œπ‘–π‘›π‘‘π‘  π‘‘π‘œ β„Žπ‘¦π‘π‘’π‘Ÿ π‘π‘™π‘Žπ‘›π‘’ 𝑖𝑠 𝑔𝑖𝑣𝑒𝑛 𝑏𝑦
    𝑑 =
    𝑀1π‘₯1+𝑀 2𝑦1+π‘€π‘œ | | 𝑀12+𝑀22
    =𝑀1π‘₯1+𝑀2𝑦1+π‘€π‘œ | |
    ||π‘Š|| =π‘€π‘œ+𝑀𝑇π‘₯| ||π‘Š|| π‘€π‘Žπ‘Ÿπ‘”π‘–π‘› π‘€π‘œ+𝑀𝑇π‘₯| ||π‘Š||
    π‘‘π‘Ÿ = ||π‘Š|| π‘šπ‘–π‘›π‘–π‘’π‘š π‘π‘œπ‘›π‘ π‘‘π‘Ÿπ‘Žπ‘–π‘› π‘‘π‘œ 𝑦 * π‘€π‘œ + 𝑀𝑇
    ( π‘₯)β‰₯1
    π‘‚π‘π‘‘π‘–π‘šπ‘–π‘§π‘Žπ‘‘π‘–π‘œπ‘›: π‘€π‘–π‘›π‘–π‘šπ‘–π‘§π‘’ π‘‘β„Žπ‘’ = ||π‘Š|| π‘“π‘œπ‘Ÿ π‘šπ‘Žπ‘‘β„Ž π‘ π‘–π‘šπ‘π‘™π‘–π‘π‘–π‘‘π‘¦ 𝑖𝑛 𝑑𝑒π‘₯𝑑 π‘π‘œπ‘œπ‘˜π‘  π‘Ÿπ‘’π‘‘π‘’π‘Ÿπ‘› π‘Žπ‘  =12 𝑀2
    π‘€π‘–π‘›π‘–π‘šπ‘–π‘§π‘’ π‘‘β„Žπ‘’ 12 𝑀2
    𝑠𝑒𝑏𝑗𝑒𝑐𝑑 π‘‘π‘œ π‘‘β„Žπ‘’ π‘π‘œπ‘›π‘ π‘‘π‘Ÿπ‘Žπ‘–π‘› 𝑦 * π‘€π‘œ + 𝑀𝑇( π‘₯)
    𝐿(π‘₯, 𝑦, Ξ») = 𝑓(π‘₯, 𝑦) βˆ’ Ξ» * 𝑔(π‘₯, 𝑦)
    𝐿 π‘€π‘œ
    ( , 𝑀, Ξ») = ||π‘Š|| βˆ’ Ξ» * [𝑦 * π‘€π‘œ + 𝑀𝑇( π‘₯) βˆ’ 1]𝐿 π‘π‘œ
    ( , 𝑀, Ξ») = ||π‘Š|| βˆ’ Ξ» * [𝑦 * π‘π‘œ + 𝑀𝑇( π‘₯) βˆ’ 1] 𝐿 π‘π‘œ
    ( , 𝑏, Ξ») = ||π‘Š|| βˆ’ Ξ» * [𝑦 * π‘π‘œ + 𝑏𝑇( π‘₯) βˆ’ 1]
    πΉπ‘œπ‘Ÿ π‘šπ‘Žπ‘›π‘¦ π‘‘π‘Žπ‘‘π‘Žπ‘π‘œπ‘–π‘›π‘‘π‘  𝐿 π‘€π‘œ( , 𝑀, Ξ») = ||π‘Š|| βˆ’π‘–=1π‘›βˆ‘ λ𝑖* [𝑦𝑖* π‘€π‘œ + 𝑀 * π‘₯𝑖( ) βˆ’ 1]𝐿 π‘€π‘œ
    ( , 𝑀, Ξ») =12 𝑀2 βˆ’π‘–=1π‘›βˆ‘ λ𝑖* [𝑦𝑖* π‘€π‘œ + 𝑀 * π‘₯𝑖( ) βˆ’ 1]
    π‘€β„Žπ‘’π‘Ÿπ‘’ λ𝑖 𝑖𝑠 π‘‘β„Žπ‘’ πΏπ‘Žπ‘”π‘Ÿπ‘Žπ‘›π‘”π‘’ π‘šπ‘’π‘™π‘‘π‘–π‘π‘™π‘–π‘’π‘Ÿπ‘  π‘Žπ‘ π‘ π‘œπ‘π‘–π‘Žπ‘‘π‘’π‘‘ π‘€π‘–π‘‘β„Ž π‘’π‘Žπ‘β„Ž π‘π‘œπ‘›π‘ π‘‘π‘Ÿπ‘Žπ‘–π‘›π‘‘
    πΆπ‘Žπ‘ π‘’ βˆ’ 1: 𝑑𝐿𝑑𝑀 = 0
    𝑑𝐿𝑑𝑀 = 𝑀 βˆ’π‘–=1π‘›βˆ‘ λ𝑖* 𝑦𝑖* π‘₯
    𝑖 = 0𝑀 =𝑖=1π‘›βˆ‘ Ξ»
    𝑖,𝑦𝑖,π‘₯𝑖
    π‘‡β„Žπ‘–π‘  π‘ β„Žπ‘œπ‘€π‘  π‘‘β„Žπ‘Žπ‘‘ π‘‘β„Žπ‘’ π‘€π‘’π‘–π‘”β„Žπ‘‘ π‘£π‘’π‘π‘‘π‘œπ‘Ÿ 𝑀 𝑖𝑠 π‘Ž π‘™π‘–π‘›π‘’π‘Žπ‘Ÿ π‘π‘œπ‘šπ‘π‘–π‘›π‘Žπ‘‘π‘–π‘œπ‘› π‘œπ‘“ π‘‘β„Žπ‘’ π‘‘π‘Ÿπ‘Žπ‘–π‘›π‘–π‘›π‘” 𝑒π‘₯π‘Žπ‘šπ‘π‘™π‘’π‘ ,
    π‘€β„Žπ‘’π‘Ÿπ‘’ π‘‘β„Žπ‘’ π‘π‘œπ‘’π‘“π‘“π‘–π‘π‘–π‘’π‘›π‘‘π‘  π‘Žπ‘Ÿπ‘’ 𝑔𝑖𝑣𝑒𝑛 𝑏𝑦 π‘‘β„Žπ‘’ πΏπ‘Žπ‘”π‘Ÿπ‘Žπ‘›π‘”π‘’ π‘šπ‘’π‘™π‘‘π‘–π‘π‘™π‘–π‘’π‘Ÿπ‘  λ𝑖.
    πΆπ‘Žπ‘ π‘’ βˆ’ 2:
    π‘‘πΏπ‘‘π‘€π‘œ= 0𝐿 π‘€π‘œ
    ( , 𝑀, Ξ») =12 𝑀2 βˆ’π‘–=1π‘›βˆ‘ λ𝑖* [𝑦𝑖* π‘€π‘œ + 𝑀 * π‘₯𝑖( ) βˆ’ 1]
    π‘‘πΏπ‘‘π‘€π‘œ=βˆ’π‘–=1
    π‘›βˆ‘ λ𝑖* 𝑦𝑖 = 0
    𝑖=1
    π‘›βˆ‘ λ𝑖* 𝑦𝑖 = 0
    π‘π‘œπ‘€ 𝑠𝑒𝑏𝑠𝑑𝑖𝑒𝑑𝑒 𝑀 =𝑖=1
    π‘›βˆ‘ λ𝑖,𝑦𝑖,π‘₯𝑖 π‘œπ‘› πΏπ‘’π‘”π‘Ÿπ‘Žπ‘›π‘”π‘’π‘  π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘› 𝐿 π‘€π‘œ
    ( , 𝑀, Ξ») =12 𝑀2 βˆ’π‘–=1
    π‘›βˆ‘ λ𝑖* [𝑦𝑖* π‘€π‘œ + 𝑀 * π‘₯𝑖( ) βˆ’ 1]
    π‘šπ‘Žπ‘₯π‘–π‘šπ‘–π‘§π‘’
    𝑖=1 π‘›βˆ‘ λ𝑖 βˆ’12 𝑗=1
    π‘›βˆ‘π‘—=1π‘›βˆ‘ λ𝑖λ𝑗𝑦𝑖𝑦𝑗(π‘₯𝑖* π‘₯𝑗) 𝑠𝑒𝑏𝑗𝑒𝑐𝑑 π‘‘π‘œ
    𝑖=1 π‘›βˆ‘ λ𝑖* 𝑦𝑖 = 0
    ● π‘₯𝑖,π‘₯𝑗 π‘‘π‘Žπ‘‘π‘Ž π‘π‘œπ‘–π‘›π‘‘π‘  𝑦𝑖,𝑦𝑗 π‘π‘™π‘Žπ‘ π‘ π‘’π‘  π‘π‘œπ‘‘β„Ž π‘Žπ‘Ÿπ‘’ π‘Žπ‘£π‘Žπ‘–π‘™π‘Žπ‘π‘™π‘’ 𝑖𝑛 π‘Ž π‘‘π‘Žπ‘‘π‘Ž
    β–ͺ 𝑏𝑦 π‘Žπ‘π‘π‘™π‘¦π‘–π‘›π‘” π‘Žπ‘™π‘™ π‘œπ‘’π‘Ÿ π‘‘π‘Žπ‘‘π‘Ž π‘π‘œπ‘–π‘›π‘‘π‘  𝑀𝑒 π‘π‘Žπ‘› 𝑔𝑒𝑑 λ𝑖
    β–ͺ π‘“π‘œπ‘Ÿ π‘’π‘Žπ‘β„Ž π‘‘π‘Žπ‘‘π‘Ž π‘π‘œπ‘–π‘›π‘‘ 𝑀𝑒 𝑀𝑖𝑙𝑙 𝑔𝑒𝑑 Ξ»
    π‘‡β„Žπ‘’ π‘”π‘œπ‘Žπ‘™ 𝑖𝑠 π‘›π‘œπ‘€ π‘‘π‘œ 𝑓𝑖𝑛𝑑 π‘‘β„Žπ‘’ π‘œπ‘π‘‘π‘–π‘šπ‘Žπ‘™ Ξ»
    π‘‡β„Žπ‘’ λ𝑖 π‘£π‘Žπ‘™π‘’π‘’π‘  π‘‘π‘’π‘‘π‘’π‘Ÿπ‘šπ‘–π‘›π‘’ π‘€β„Žπ‘–π‘β„Ž π‘‘π‘Žπ‘‘π‘Ž π‘π‘œπ‘–π‘›π‘‘π‘  π‘Žπ‘Ÿπ‘’ π‘ π‘’π‘π‘π‘œπ‘Ÿπ‘‘ π‘£π‘’π‘π‘‘π‘œπ‘Ÿπ‘  𝑖. 𝑒 Ξ» 𝑖> 0 𝑗=1 𝑛 βˆ‘ 𝑗=1 π‘›βˆ‘ Ξ» ( 𝑖 , 𝑦 , j) (π‘₯𝑖* π‘₯ 𝑗) 𝑀12 +𝑀22 = ||𝑀|| = (π‘Š * π‘Š)12 =12 𝑀 * 𝑀𝐿(π‘₯, 𝑦, Ξ») =12 𝑀 * 𝑀 βˆ’ Ξ» * 𝑦 * π‘€π‘œ + 𝑀𝑇( π‘₯)
    𝑆𝑑𝑒𝑝 βˆ’ 1: π‘€π‘Žπ‘˜π‘’ π‘‘β„Žπ‘’ π‘π‘™π‘Žπ‘ π‘ π‘’π‘  π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘› 𝑦 π‘€π‘œ + 𝑀𝑇( * π‘₯) > 1𝑦 = 1
    π‘π‘™π‘Žπ‘ π‘ 1 π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘› π‘€π‘œ + 𝑀𝑇* π‘₯ > 1𝑦 =βˆ’ 1
    π‘π‘™π‘Žπ‘ π‘ 2 π‘’π‘žπ‘’π‘Žπ‘‘π‘–π‘œπ‘› π‘€π‘œ + 𝑀𝑇* π‘₯ < 1 𝑆𝑑𝑒𝑝 βˆ’ 2: πΌπ‘›π‘π‘Ÿπ‘’π‘Žπ‘ π‘’ π‘‘β„Žπ‘’ π‘šπ‘Žπ‘Ÿπ‘”π‘–π‘› π‘‘π‘–π‘ π‘‘π‘Žπ‘›π‘π‘’ π‘œπ‘“ π‘‘β„Žπ‘’ π‘‘π‘Žπ‘‘π‘Ž π‘π‘œπ‘–π‘›π‘‘ π‘‘π‘œ π‘‘β„Žπ‘’ β„Žπ‘¦π‘π‘’π‘Ÿπ‘π‘™π‘Žπ‘›π‘’ 𝑑 =𝑀1 π‘₯1+𝑀 2𝑦1+π‘€π‘œ | | 𝑀 12+𝑀 22 =𝑀1π‘₯ 1+𝑀 2𝑦1+π‘€π‘œ | | ||π‘Š|| =π‘€π‘œ+𝑀𝑇π‘₯ ||π‘Š|| 𝑆𝑑𝑒𝑝 βˆ’ 3: π·π‘’π‘π‘Ÿπ‘’π‘Žπ‘ π‘’ π‘‘β„Žπ‘’ ||𝑀|| 𝑆𝑑𝑒𝑝 βˆ’ 4: π·π‘’π‘π‘Ÿπ‘’π‘Žπ‘ π‘’ π‘‘β„Žπ‘’ ||𝑀|| π‘π‘Žπ‘ π‘’π‘‘ π‘œπ‘› π‘π‘œπ‘›π‘ π‘‘π‘Ÿπ‘Žπ‘–π‘› 𝑦 π‘€π‘œ + 𝑀𝑇( * π‘₯) > 1 π‘Žπ‘π‘π‘™π‘¦ π‘™π‘’π‘”π‘Ÿπ‘Žπ‘›π‘”π‘’π‘ 
    π‘₯, 𝑦, 𝑖=(2, 2) 1(4, 4) 1(4, 0) -1(0, 0) 1
    π‘₯, 𝑖, Ξ»=(2, 2) 0.25 (4, 4) 0 (4, 0) 0.25 (0, 0) 0
    π‘ π‘œ π‘ π‘’π‘π‘π‘œπ‘Ÿπ‘‘ π‘£π‘’π‘π‘‘π‘œπ‘Ÿπ‘  π‘Žπ‘Ÿπ‘’ (2, 2) π‘Žπ‘›π‘‘ (4, 0)
    𝑀 =𝑖=1
    π‘›βˆ‘ Ξ»=𝑖 , 𝑦 , 𝑖
    π‘₯𝑖 = 0. 25 * 1 * (2, 2) + 0. 25 * (βˆ’ 1) * (4, 0) = (0. 5, 0. 5) βˆ’ (1, 0) = (0. 5 βˆ’ 1, 0. 5 βˆ’ 0) = (βˆ’ 0. 5
    π‘€π‘œ + 𝑀𝑇
    π‘₯ = 1π‘€π‘œ + 𝑀1* π‘₯
    1 + 𝑀2* π‘₯
    2 = 1 π‘€π‘œ βˆ’ 0. 5 * 2 + 0. 5 * 2
    = 1 π‘€π‘œ βˆ’ 1 + 1
    = 1 π‘€π‘œ
    = 1βˆ’ 0. 5 * π‘₯1 + 0. 5 * π‘₯2 + 1

kamblenayan826

Leave a Reply

Your email address will not be published. Required fields are marked *