منابع پایان نامه درباره داده ها و اطلاعات، شهروندان تهران، کاوش اطلاعات، درون داده

0 Comments

مقادیر صحیح کد منطقه و ناحیه در کلیه رکوردهای جدول کنترل می شد. لذا با انجام پرس جو60 های متعدد از طریق نرم افزار Sql 2008 دو فیلد جدید به انتهای جدول پیام اضافه و مقادیر کد منطقه و ناحیه شناسایی شده که ترکیب آن (نام منطقه – نام ناحیه) در ستون دیگری از همان جدول قرار داشت به صورت عددی و تفکیک شده، اضافه گردید. در مواردی که نام منطقه یا ناحیه در ستون مربوطه آورده نشده بود، تلاش شد تا از طریق ستون متن پیام، مقادیر آن شناسایی گردد. که تکمیل داده ها به این روش بسیار زمان بر بود. البته در مواردی که کد ناحیه ومنطقه از هیچ روشی قابل تعیین نبود به ناچار رکورد مربوط به آن از مجموعه رکوردهای مورد بررسی حذف گردید.
طبق بررسی های انجام شده بر روی داده ها مشخص گردید بخشی از پیام های ثبت شده در این سامانه مربوط به تماس های شهروندان با شهرداری نبوده بلکه مربوط می شود به شکایات یا درخواست های کارکنان و پرسنل سازمان شهرداری از واحدهای اجرایی همان سازمان. بنابراین با توجه به این که اساساً این رکوردها موضوعیتی با نیازها و معضلات شهری شهروندان تهرانی پیدا نمی کرد، به ناچار از مجموعه رکوردهای مورد بررسی حذف گردید.
همان طور که پیش تر گفته شد داده های سامانه 137 (جدول پیام ها) بر اساس نوع و موضوع پیام 644 عنوان دارد که ذیل 51 عنوان کلی طبقه بندی شده است. به عبارت دیگر در مجموع 644 نوع مشکل در سطح شهر تهران شناسایی شده است که هر کدام در یکی از 51 طبقه تعیین شده قرار می گیرد. با بررسی های به عمل آمده بر روی داده ها مشخص شد در برخی از این 51 طبقه، تعداد تماس های شهروندان بسیار کم و ناچیز می باشد. به عبارت دیگر فراوانی بسیار کم آن ها در میان سایر مشکلات نشان دهنده موردی بودن و بی اهمیت بودن مشکلات آن طبقه بود و از آن جا که بیم آن می رفت که در روند تکرار پذیری پیام ها اختلال ایجاد نماید لذا با امکان پرس جوی نرم افزار Sql 2008 این طبقه ها شناسایی و به همراه مشکلات آن طبقه از مجموع داده های مورد بررسی حذف گردیدند.
گفته شد که مرحله آماده سازی داده ها مهم ترین و زمان بر ترین بخش از فرایند داده کاوی محسوب می شود. در این بخش، فارسی بودن اکثر فیلدهای جدول پیام و نیز حجم زیاد رکوردها خود منجر به طولانی تر شدن این مرحله گردید به گونه ای که محقق برای جلوگیری از حذف رکوردهای صحیح ، که به علت رشته ای بودن نوع فیلدها ممکن بود رخ دهد، این مرحله را با صرف زمان و دقت بیشتری به انجام رساند.
در نهایت پس از مرحله آماده سازی، داده ها در قالب SPSS تجمیع و به عنوان ورودی در نرم افزار Clementine مورد استفاده قرار گرفت.
مدل سازی
در این مرحله گام های زیر دنبال شده است که جزئیات آن در ادامه بیان شده است:
انتخاب تکنیک های مدل سازی
ساخت مدل
ارزیابی مدل
برای مدل سازی لازم است که ابتدا تکنیک مدل سازی انتخاب شود. با توجه به این که هدف از انجام این تحقیق انجام تکنیک های مختلف بر روی داده های سامانه 137 شهرداری تهران و بررسی نتایج به دست آمده از هر تکنیک می باشد؛ لذا تکنیک های مختلف داده کاوی نظیر خوشه بندی، قوانین وابستگی، درخت تصمیم، مدل خطی تعمیم یافته بر روی داده ها انجام و نتایج آن در فصل بعد آورده شده است. در هر مرحله سعی شده است با توجه به نوع داده ها بهترین الگوریتم انتخاب شود.
ارزیابی نتایج
در این مرحله گام های زیر دنبال شده استکه جزئیات آن در ادامه بیان شده است:
ارزیابی نتایج
مرور نمودن فرایند
نتایج به دست آمده در مرحله قبل به عنوان دانش استخراج شده از تحقیق تلقی می گردد. در مرحله قبل نتایج حاصل از اجرای تکنیک های داده کاوی در هر بخش با الگوریتم دیگری مورد مقایسه قرار گرفت. سپس با توجه به مقایسه های صورت گرفته الگوریتم مناسب انتخاب گردیده است.
برای اطمینان از صحت عملیات انجام شده فرایند کار در نهایت مرور گردیده است.
به کارگیری مدل
در آخرین مرحله، گزارش نهایی از محصول که همان دانش کشف شده است صورت می گیرد. کار اصلی تحلیل گر یا داده کاو در مرحله قبل به اتمام رسیده و در این تحقیق نیز نتایج، به صورت یک گزارش از کل کار در اختیار سازمان مربوطه یا داوطلبان قرار می گیرد تا راجع به استفاده از نتایج تصمیم گیری نمایند.
نکته ای که لازم است در انتهای این بخش به آن اشاره شود این است که تحقیق صورت گرفته می توانست در صورت وجود برخی فیلدهای اطلاعاتی دیگر که در فصل اول به آن ها اشاره شد، بسیار جامع تر گردد.
مدل اجرایی تحقیق
مدل اجرایی تحقیق براساس آن چه بیان شد، مطابق شکل 3-2 می باشد. در فصل بعد چرایی انتخاب هر یک از موضوعات شرح داده شده است.

شکل3-2 روش اجرایی تحقیق

خلاصه فصل سوم
در این فصل روش تحقیق تحقیق صورت گرفته به صورت گام به گام، تشریح گردید. روش انجام تحقیق بر مبنای استفاده از یک مدل استاندارد داده کاوی می باشد که مراحل اجرای تحقیق با الگوگیری از این مدل به صورت گام به گام مورد بررسی قرار گرفت. هم چنین کلیاتی در خصوص داده های تحقیق بیان گردید.
در نهایت این که در این فصل تمامی مراحلی که در فصل بعد بر روی داده ها صورت می پذیرد؛ پوشش داده شده است .

تجزیه و تحلیل داده ها

مقدمه
همان طور که در فصـل قبل به آن اشـاره شد، شـهرداری یـکی از مـهم ترین سـازمان هـایی است که نقش عمده ای در ارائه ی خدمات شهری به شهروندان ایفا می کند. سامانه ی مرکز مدیریت شهری 137 نیز پل ارتباطی این سازمان با شهروندان در رسیدگی به معضلات و مشکلات شهری است. کاوش داده ها و اطلاعات جمع آوری شده از طریق این سامانه می تواند منجر به شناسایی الگوهای مهم و پنهانی شود که پیش از آن ممکن است مورد توجه قرار نمی گرفته و دانستن آن مدیران شهری را در ارائه ی مطلوب خدمات شهری به شهروندان یاری می رساند.
در این فصل داده های سامانه ی 137 را از دو منظر توصیفی و تحلیلی بررسی خواهیم کرد. در بخش توصیفی، روش ها و نمودارهای آماری متداول به منظور آشنایی مقدماتی با وضیعت مشکلات و معضلات شهری در سال 89 به کار گرفته شده است و در بخش تحلیلی از تکینک های پرکاربرد داده کاوی برای کاوش اطلاعات و شناسایی دانش پنهان درون داده ها استفاده شده است. در ادامه جزئیات ساختار اجرایی و پیاده سازی روش تحقیق تشریح گردیده است.

توصیف داده ها
از آن جا که لازم است تا شناخت مناسبی از داده های تحقیق و چگونگی آماده سازی آن ها قبل از اعمال مدل ها و الگوریتم های مختلف کسب گردد؛ در این بخش هم به ویژگی داده ها و هم به مراحل آماده سازی داده ها پرداخته شده است، در ادامه هر قسمت به طور کامل تشریح شده است.
همان طور که در فصل قبل تشریح شد داده های اصلی مورد استفاده در این تحقیق حاوی رکوردهای ثبت شده در بانک اطلاعاتی سامانه مدیریت شهری 137 شهرداری تهران در بازه ی سال 1389 می باشد. تعداد کل رکوردها قبل از فرایند آماده سازی داده ها، برابر 1.135.237 می باشد که هر کدام مربوط به یک تماس از جانب شهروندان در زمینه ی هر یک از مسایل و موضوعات شهری مرتبط با شهرداری تهران می باشد.
ساختار اولیه جداول اطلاعاتی به کار رفته، پیش از مرحله آماده سازی داده ها به شرح ذیل می باشد:
جدول4-1 : فیلد های جدول پیام
نام فیلد
شرح فیلد
MessageCode
شناسه پیام که یک عدد یونیک به ازای هر تماس می باشد
CategoryName
طبقه یا گروه مشکل
SubjectName
موضوع مشکل
MessageSolarDate
تاریخ وقوع مشکل
LastStateName
آخرین وضعیت رفع مشکل
LastStateDate
تاریخ اتمام رسیدگی به مشکل
LastUnitName
منطقه و ناحیه وقوع مشکل
MessageText
شرح مشکل ذکر شده با جزئیات
CitizenFirstName
نام شهروند
CitizenLastName
نام خانوادگی شهروند
CitizenPhone
شماره تلفن شهروند
CitizenMobile
شماره موبایل شهروند

جدول 4-2: فیلد های جدول اطلاعاتی مربوط به اعتبار مصوب عمرانی مناطق

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *