डेटा के सामान्यीकरण के 3 चरण

डेटा के सामान्यीकरण की प्रक्रिया में शामिल होने वाले कुछ महत्वपूर्ण चरण निम्नानुसार हैं:

तालिकाओं में डेटा तत्वों को समूहीकृत करने के कई तरीके हैं। डेटाबेस डिज़ाइनर उस तरीके को चुनने में रुचि रखेगा जो डेटा ग्रुपिंग में कोई विसंगति सुनिश्चित न करे। इन विसंगतियों में डेटा अतिरेक, डेटा की हानि और डेटा में गंभीर संबंध शामिल हैं।

चित्र सौजन्य: 4.bp.blogspot.com/-MTnjMQCPoRI/Tu4HGFKjV2I/AAAAAAAAAHQ/md1Cz89KH1U/1616/2service.jpg

सामान्यीकरण का उद्देश्य डेटा में विसंगतियों को दूर करना है। सामान्यीकरण की प्रक्रिया में तीन चरण शामिल हैं, प्रत्येक चरण सामान्य रूप में एक तालिका बनाता है।

1. पहला सामान्य रूप:

सामान्यीकरण का पहला चरण सभी दोहराया क्षेत्रों को अलग-अलग फाइलों में डाल रहा है और उन्हें उपयुक्त कुंजी प्रदान कर रहा है।

खरीद आदेश के प्रसंस्करण का उदाहरण लेते हुए निम्नलिखित डेटा तत्वों को एक खरीद क्रम में पहचाना जा सकता है:

आपूर्तिकर्ता आईडी

आपूर्तिकर्ता का नाम

पता

खरीद क्रम संख्या

दिनांक

भुगतान की शर्तें

शिपिंग के शर्तें

एस।

उत्पाद कोड

विवरण

माप की इकाई

मूल्य

आदेशित मात्रा

रकम

जैसा कि ऊपर उल्लेख किया गया है, प्रत्येक S. No. के लिए 'शिपिंग शर्तें' दोहराई जाती हैं और प्रत्येक खरीद क्रम में इसके लिए कई रिकॉर्ड होंगे। सामान्यीकरण के पहले चरण में, दोहराया डेटा तत्वों को अलग-अलग तालिकाओं में रखा जाता है। इस प्रकार, हम नीचे दिखाए अनुसार डेटा तत्वों को दो तालिकाओं में विभाजित करते हैं:

प्रमुख डेटा तत्वों को बड़े अक्षरों में दिखाया गया है। तालिका अब पहले सामान्य रूप (INF) में है क्योंकि सभी दोहराया डेटा तत्व (फ़ील्ड) एक अलग तालिका (तालिका 1.2) में हैं और पुनर्प्राप्ति कुंजी प्रत्येक तालिका को सौंपी गई हैं। चूंकि दोनों तालिकाओं में दो प्रमुख तत्व हैं, इसलिए यह कहा जा सकता है कि प्रत्येक तालिका में यौगिक / समग्र कुंजी हैं। सामान्यीकरण की इस प्रक्रिया ने डेटा को सरल बना दिया है।

2. दूसरा सामान्य रूप:

सामान्यीकरण के इस चरण में, सभी गैर-महत्वपूर्ण तत्व जो पूरी तरह से पूरी कुंजी के अलावा किसी अन्य चीज से पूरी तरह से निर्दिष्ट होते हैं, उन्हें एक अलग तालिका में रखा जाता है। आम तौर पर, ये गैर-कुंजी तत्व केवल यौगिक कुंजी के एक भाग पर निर्भर होते हैं।

तालिका 1.1 को ध्यान में रखते हुए, एक समग्र कुंजी जिसमें आपूर्तिकर्ता_ आईडी और खरीद क्रम सं। उपयोग किया जा रहा है। हालाँकि, गैर प्रमुख तत्व जैसे कि आपूर्तिकर्ता का नाम और पता केवल आपूर्तिकर्ता_ आईडी पर निर्भर है और खरीद क्रम सं। इस प्रकार, इन गैर-कुंजी डेटा तत्वों को प्रमुख डेटा तत्व-आपूर्तिकर्ता_ आईडी के साथ अलग-अलग तालिकाओं में रखा जाता है।

इसी तरह, गैर-प्रमुख डेटा तत्व जैसे दिनांक, भुगतान की शर्तें और शिपिंग शर्तें केवल खरीद आदेश संख्या पर निर्भर हैं। और इस प्रकार एक अलग तालिका में खरीद क्रम सं। मुख्य तत्व के रूप में। अब, हमारे पास तालिका 1.1 के स्थान पर तीन तालिकाएँ हैं:

इसी तरह, हम गैर-महत्वपूर्ण तत्वों जैसे विवरण, माप की इकाई और मूल्य को अलग करके तालिका 1.2 को विभाजित कर सकते हैं, जो केवल तालिका में उत्पाद कोड पर निर्भर हैं। इसी तरह, उत्पाद क्रम, मात्रा और खरीद क्रम संख्या और एस नंबर पर निर्भर राशि को एक अलग तालिका में रखा जाता है।

दूसरा सामान्य रूप (2NF) अब तैयार है और इसमें पाँच टेबल हैं।

3. तीसरा सामान्य रूप:

सामान्यीकरण का यह चरण अनावश्यक डेटा तत्वों और तालिकाओं को समाप्त करने में सक्षम बनाता है जो अन्य तालिकाओं के सबसेट हैं। निरर्थक तत्व वे गैर-कुंजी डेटा तत्व हैं जिन्हें वर्चुअल डेटा तत्वों की एक से अधिक तालिका में रखा गया है।

आभासी डेटा तत्व वे तत्व होते हैं, जिनके मूल्य की मांग होने पर अन्य तत्वों का उपयोग करके गणना की जा सकती है। तालिका 1.2.2 में राशि डेटा तत्व का मूल्य मात्रा के साथ गुणा करके गणना की जा सकती है जिससे इस तरह के अनावश्यक डेटा तत्वों को समाप्त किया जा सके।

यदि डेटाबेस में आपूर्तिकर्ता मास्टर टेबल नामक एक अन्य तालिका भी बनाए रखी जा रही है, तो संभावना है कि तालिका 1.1.2 आपूर्तिकर्ता की मास्टर तालिका का सबसेट होगी। इस प्रकार, यह तालिका भी समाप्त हो सकती है।

तीसरा सामान्य रूप (3NF) डेटा के समूहीकरण को सरल, आसानी से बनाए रखने योग्य और न्यूनतम अतिरेक के साथ प्रदान करता है।

इस प्रकार, सामान्यीकरण अतिरेक को कम करने के साथ-साथ डेटा में अन्य विसंगतियों को समाप्त करने में मदद कर सकता है। ऊपर चर्चा की गई तीन-चरण सामान्यीकरण प्रक्रिया केवल विचारोत्तेजक है। डेटा की प्रकृति के आधार पर, यदि आवश्यक हो तो डेटाबेस डिजाइन करते समय आगे प्रयास किए जा सकते हैं।