קידום אתרים בוורדפרס: כיצד להשתמש ברג'אקס (regex) כדי לשנות *המון* קישורים בעלי מבנה דומה

רקע

במזל טוב, האתר "רשימות" התחילו לאפשר העברה של הבלוגים של הכותבים ברשימות למערכת וורדפרס (באיכסון עצמי, או באיכסון של wordpress.com).

לכבוד זאת, סייעתי לאחי שוקי להעביר את הבלוג שלו לבלוג עצמאי חדש ונוצץ: "שוקי 101".

האתגר: שימור קישורים פנימיים

אבל המעבר הציב אתגר SEO: כלי ההמרה של רשימות מאפשר להעביר פוסטים מהבלוג הישן לבלוג החדש, אבל אם בבלוג הישן היה לכם לינקים שהפנו אל האתר הישן (המכונים גם internal links), הם ימשיכו לקשר לאתר הישן (ולא לחדש) גם לאחר המעבר..
כלומר – לאחר המעבר מרשימות לבלוג אחר, הלינקים הפנימיים של הבלוג שלכם יהפכו להיות לינקים חיצוניים לבלוג הישן שלכם. מבחינת SEO זה מאד לא רצוי.

אז איך פותרים זאת?
אפשרות אחת היא לעבור פוסט פוסט, לחפש לינקים ולתקן את כולם. בהתחשב בזה שאחי שוקי כותב את הבלוג שלו משנת 2003 וכתב קרוב ל- 1,200 פוסטים, החלטנו בפה אחד שנוותר על הרעיון הזה. אז מה עוד אפשר לעשות?

הערה שחשוב להדגיש

לאחר פירסום הפוסט פנה אלי אורי ברוכין וכתב לי הערה שחשוב לי שתועבר הלאה (בתימצות – הכל יהיה טוב), ובאריכות:

גם אם הלינקים החדשים שלהם אינם נראים מבוססי הקוד, הרי שייצאנו את כל הפוסטים מלכתחילה עם הקוד הזה, כך שגם לינק עם קוד עובד, מלכתחילה, אצל כולם. על זה יהיו מבוססות ההפניות האוטומטיות מהאתר הישן.
זה אומר גם שמי שלא ישנו – הלינקים הפנימיים פשוט יעבירו אל ההפנייה ואז בחזרה ללינק המתאים בבלוג החדש – אז אין מה לדאוג. לאלה ש-SEO חשוב להם במיוחד, מומלץ להשתמש בפתרון שלך, אבל לשאר עדיף לא להסתבך עם זה.

אני מבקש להדגיש זאת שוב: גם אם לא תשתמשו במה שאני מתאר בבלוג שלי, הרי שבעתיד (הנראה לעין), אנשים שילחצו על קישור יגיעו לאתר רשימות ומשם יופנו חזרה לבלוג שלכם. כך שמבחינת גולשים, אתם תהיו בסדר בכל מקרה.
הייתרון בשיטה שאני מציע הוא לאלו מכם שמעניין אותם כל הקטע הזה של SEO (וגם כן, אף אחד לא יודע באמת עד כמה זה קריטי. אבל לנו זה נראה מספיק מעניין כדי לבדוק ולגלות איך עושים זאת – גם אם לא תעשו את מה שאני מציע, יהיה בסדר)

הפתרון: החלפת לינקים באופן מובנה (בעזרת regex)

יש כמה שלבים לפתרון הנוכחי:
0) בצעו גיבוי מלא של הבלוג שלכם!!! (wp-dbmanager הוא פתרון טוב בעיני, כי הוא מאפשר לשחזר גיבויים בקלות רבה)
1) עליכם להתקין את תוסף הוורדפרס (הנהדר): Search Regex
2)
היות ושוקי הוא מקדם אתרים משכמו ומעלה, הוא חזה מראש את הבעיה הזו ודאג (כך הבנתי) שמספר הפוסט שהיה לו בבלוג ברשימות יהיה גם מספר הפוסט שלו בבלוג וורדפרס החדש שלו.
כך לדוגמא, הלינק של פרוייקט הטחינה הגדול (סדרת הפוסטים המיתולוגית שהובילה להקמה של בלוג החומוס), הייתה בבלוג ברשימות:
http://notes.co.il/shooky/8508.asp
ובבלוג החדש היא נהפכה להיות:
http://www.shooky101.com/?p=8508

המבנה הקבוע הזה מאפשר לנו ליצור מערכת כללים שימירו את הלינקים הפנימיים מהבלוג הישן, להיות לינקים פנימיים לבלוג החדש. וכך עשיתי זאת.

כעת עליכם להכנס לתפריט ה "search regex" תחת "כלים" ולהתחיל לבצע החלפות. סמנו את תיבת ה – regex. ובחרו ב post content בתור ה source. כעת מלאו את הפרטים באופן הבא (החליפו את שם האתר של שוקי שמופיע בדוגמאות, לשם האתר שלכם)
שלב א: (החלפת כל פעם ששוקי נתן לינק לעמוד הבית שלו), מלאו את
חיפוש ב: @"http://(?:www\.)?notes\.co\.il/shooky/"@
החלפה ב: "http://www.shooky101.com/"

תלחצו על הכפתור "replace" כדי לראות מה התוצאות (כך שאין שום בעיות יוצאות דופן). אם הכל הולך כשורה לחצו על "replace and save" כדי לשמור את התוצאות לבסיס הנתונים.

שלב ב: (אותו הדבר אבל בלי סלש)
חיפוש ב: @"http://(?:www\.)?notes\.co\.il/shooky"@
החלפה ב: "http://www.shooky101.com/"

שלב ג: (להחליף את כל המקרים שיש בהם לינק עם מספר, ללינק החדש כאשר המספר נכנס למקום המתאים בלינק החדש = קסם!)
חיפוש ב: @"http://(?:www\.)?notes\.co\.il/shooky/(.*[0-9])\.asp"@
החלפה ב: "http://www.shooky101.com/?p=$1"

שלב ד: (אותו הדבר, אבל למקרים שבהם לא היה סיומת asp ללינק המקורי)
חיפוש ב: @"http://(?:www\.)?notes\.co\.il/shooky/(.*[0-9])"@
החלפה ב: "http://www.shooky101.com/?p=$1"

שלב ה: (פותר עוד כמה מקרים שלא ברור לי למה הם לא נתפסו קודם לכן)
חיפוש ב: @"http://(?:www\.)?notes\.co\.il/shooky/(.*?)\.asp"@
החלפה ב: "http://www.shooky101.com/?p=$1"

שלב ו: (לבדוק ללא סימן ה regex, האם פיספסנו משהו)
חיפוש של: http://notes.co.il/shooky
(בשלב הזה מצאתי כאלו מקרים כאשר היו פגמים בלינק)

למהדרים, אפשר גם לטפל קצת בלינקים שבתגובות. אם תבחרו בתור source את comment author URL,
תוכל לבצע משהו כמו זה (שימו לב שהפעם אין "גרשיים", כי אף פעם לא משתמשים בהם בתגובות. זה יוצר קצת סיפור, שימו לב לסדר שבו אני מבצע את הפעולות!):

החלפה של: @http://(?:www\.)?notes\.co\.il/shooky/(.*[0-9]).asp@
ב: http://www.shooky101.com/?p=$1

ואז –

החלפה של: @http://(?:www\.)?notes\.co\.il/shooky@
ב: http://www.shooky101.com/

3) תתקינו את התוסף Broken Link Checker – כדי למצוא ולתקן עוד כל מיני מקרים (מוזרים לרוב) של לינקים שבורים/לא-תיקניים.

מקווה שעזרתי לכם (אם כן, אני אוהב לקבל תגובות בבלוג, לינקים ומסאז' טוב…)

איך להתחיל טרנד/תופעה/תנועה (ב-3 דקות)

דרק סיברס לוקח סרטון המדגים יצירה של "תנועה" (קבוצת אנשים הרוקדים, לאחר שאיש אחד רקד כמו פסיכי), ומציע תובנות משלו לתופעה:

הלקחים הגדולים של ההרצאה הם:

  1. כשאתם מתחילים תנועה, התיחסו אל העוקבים הראשונים שלכם כאל שווים. התנועה היא מה שחשוב, לא המנהיג.
  2. מי שהופך את התנועה לתופעה הם העוקבים הראשונים, לא המנהיג. אם אתם רואים מישהו עושה משהו פסיכי אבל מבריק, תתחילו לעקוב אחריו – זה מה שיוביל לשינוי.

עד כמה המסקנות האלה נותרות באירגון תנועות חברתיות שהן מעבר ל "בואו נרקוד"? אינני יודע… מה דעתך?

שחקנים – למה הם חשובים (סרטון קצר ומדהים, לכל מי שלא מבין "ת'קטע של תאטרון")

בקטע הבא (פחות מ- 7 דקות), אישה בשם פטסי מספרת 2 סיפורים כדי להסביר למה משחק (ושחקנים) הם עם חשוב.
היות והסיפור השני הציף אצלי דמעות, חשבתי שמן הראוי לשתף אתכם בו:

תוסף התגובות של וורדפרס – אינטנס דיבייט (IntenseDebate) – שוחרר בעברית!

לבעלי בלוגי הוורדפרס שביניכם שרצו הוספה ליכולת של מערכת התגובות שלהם, התוסף (נתמך האוטומאטיק) IntenseDebate פירסמו (אתמול) שכעת הם תומכים בעברית (ויישור מימין לשמאל). תודה ליואב על עבודת ההתאמה והתירגום.

אחת הייתרונות של התוסף (שאינני מכיר דרך אחרת להשיג), היא לאפשר למשתמשים שלכם "להירשם" למערכת התגובות באמצעות משתמש הטוויטר שלהם. ואז יש להם אופציה לפרסם לטוויטר שלהם את התגובה שהם פירסמו אצלכם בבלוג.

מכירים עוד "ייתרונות מנצחים" עבור המערכת הזו, התחלתם להשתמש באינטנס דיבייט? אנא ספרו לי על זה בתגובות 🙂

האם (בארה"ב) למפגינים כנגד רפורמת הבריאות יש תפיסה מוטה של מיסוי במדינתם?

רקע (מקור: ויקיפדיה)

בארה"ב, החוק להגנת החולה וטיפול בר השגה (אנגלית: Patient Protection and Affordable Care Act) הוא חוק (חלק מרפורמת הבריאות) שנועד להסדיר מתן שירותי בריאות לתושבי ארצות הברית. החוק נועד למנוע את המצב בו עשרות מיליוני אמריקנים אינם מבוטחים, למנוע מאמריקנים שמבוטחים לאבד את ביטוח הבריאות שלהם עקב החלפת מקום העבודה דרכו הם מבוטחים, או עקב טענות חברות הביטוח שהטיפולים נובעים ממצב בריאותי שקדם לתחילת הביטוח, ונועד למתן את הגידול בהוצאות על בריאות. החוק אושר בבית הנבחרים ב-21 במרץ 2010. נשיא ארצות הברית, ברק אובמה, אישר את החוק למחרת. אובמה הצהיר כי הוא מחשיב את החוק בתור ההישג הפוליטי הגדול ביותר שלו.
הרפורמה במערכת הבריאות תבטיח לראשונה ביטוח בריאות ליותר ל-30 מיליון אמריקאים שעד לאישורו לא היו מבוטחים כלל.

בשבלינו אזרחי מדינת ישראל, אשר כולנו מקבלים ביטוח בריאות כחלק מהותי משירותי המדינה אלינו, המצב של אזרחים בארה"ב (ומה שהרפורמה הזו מנסה לפתור) יכול להיות בלתי נתפס.

המחלוקת – "מפגיני מסיבת התה"

על פניו, נישמע שכולם צריכים לתמוך בזה (וברפורמת הבריאות באופן כללי), אך זה איננו המצב. קבוצה של (לרוב, רפובליקנים) החלו תנועה של הפגנות המכונות "הפגנות מסיבת התה" (עוד על כך כאן), אשר מפגינים בכלל על כל צורה של העלאת מס, ובפרט העלאת המס שתידרש (שאני לא בטוח עד כמה היא בכלל תהיה) בעקבות העברת רפורמת הבריאות שאובאמה קידם.

כדי להמחיש את הדרמטיות של התנגדות המפגינים, הנה סרטון (של פחות מדקה) המראה כיצד מפגינים צועקים על חולה פרקינסון שהתיישב והפגין (בעד רפורמת הבריאות) כנגד המפגינים (כנגד רפורמת הבריאות)

אגב, חולה הפרקינסון הזה הוא בן 60, אובחן בפרקינסון לפני 15 שנה, ולפני כן הוא עבד כמהנדס גרעיני. הוא מחזיק שני תארים שניים ודוקטורט מאוניברסיטת קורנל. הסיבה שהוא עוד לא מת היא כי הוא שילם (בעזרת ביטוח בריאות חלקי) 150,000$ עבור ניתוח שנועד להעריך את איכות חייו. ניתוח שבארץ, כנראה, שהוא היה מקבל גישה אליו בהשתתפות סימלית בהרבה. זה למה הוא מפגין בעד רפורמת הבריאות שאובאמה והדמוקרטים מקדמים. (הנה סרטון שבו בוב, חולה הפרקינסון, מדבר)

אז למה הם מתנגדים?

אחת השאלות שדמוקרטים (כמו, לדוגמא, אישתי הנהדרת) שואלים היא מדוע בכלל האנשים הללו מתנגדים לרפורמת הבריאות. הרי המצב כיום בארה"ב הוא מפלצתי, לפיו המערכת איננה מסוגלת לחשוב באופן של רפואה מונעת, וכל ניסיון להיעזר בשירותי הבריאות מסתכם במאבק (של אנשים חולים) למול חברות הביטוח, אשר יכול בפעמים רבות להוביל לפשיטת רגל של החולה (זו, מסתבר, אחת הסיבות השכיחות ביותר לפשיטות רגל בארה"ב – טיפול רפואי לאנשים ללא ביטוח בריאות "טוב").

וזה מוביל אותנו לסטטיסטיקה.

תפיסת המיסוי של ארה"ב אצל "מפגיני מסיבות התה"

דוד פרום (מישהו), הגיע לאחת מההפגנות של מסיבות התה, ופנה אל המפגיני בשאלה פשוטה "(לדעתכם) כמה מיסים גובה ממשלת הממשלה הפדרלית בארה"ב מהמשק?". על השאלה השיבו 60 מתוך כמה מאות המפגינים שנכחו במקום. הסטטיסטיקות שקיבלנו מתשובות הנבדקים היו (מקור):

תשובה ממוצעת: 42.06% (זוהי התשובה הממוצעת של אחוז המיסוי שאנשים אלו מאמינים שארה"ב גובה מהמשק)
סטיית תקן: 19.06%
מספר מפגינים שנשאלו: 60

התשובה הנכונה היא (על סמך המקור) 31.5%, שזה פחות ממה שהמפגינים ענו בממוצע. השאלה (הסטטיסטית) היא האם אמונת המפגינים לגבי שיעור המס היא מוטה כלפי מעלה באופן מובהק.

ננסח את השאלה באופן יותר מדויק: בהנחה שהמדגם של 60 איש שנשאלו הוא מדגם מייצג לדעות של אנשים מהסוג שמשתתפים בהפגנות מסוג זה (כלומר שהסוקרים לא פנו לשאול, לדוגמא, רק את האנשים שנראו הכי קיצוניים בהפגנה), האם יש לנו מספיק נתונים כדי לדעת האם הדעות של הפגינים מוטות (באופן מובהק סטטיסטית) להיות מעל למציאות? התשובה לדעתי היא כן.

ננסח את השאלה שוב (הפעם, יותר "סטטיסטית"): האם יש לנו עדות מספקת להניח שהתוחלת של התפלגות התשובות של המפגינים, היא שונה (באופן מובהק סטטיסטית) מהערך האמיתי? (זוהי השערת ה-0. ההשערה הנגדית אומרת, שייתכן והמפגינים כן ענו, בממוצע, את הערך הנכון)

באמצעות משפט הגבול המרכזי (לינק למאמרון ויקיפדיה בנושא) נענה על השאלה. לפיו אנו יודעים שהתוחלת של תשובות המפגינים שואפת להתפלגות הנורמאלית. לפי זה נוכל לחשב מהו הרווח בר-סמך התחתון של תוחלת תשובת המפגינים (או בתרגום: מהו הערך הנמוך ביותר שהיינו יכולים לחשוד שהוא הממוצע/התוחלת האמיתית של תשובות המפגינים). המספר יהיה:

42.06 – 1.96 * 19.06/sqrt(60) = 37.24

כלומר, המספר הכי נמוך (כאשר מדברים על רווח בר סמך דו-צדדי) של 95%) שאפשר לצפות שהוא התוחלת האמיתית של תשובות המפגינים, הוא 37.24%. שזה יותר גבוה מ – 31.5% מס (שהוא הערך האמיתי).

למעשה, ההסתברות שנקבל את התוצאות שקיבלנו מהשאלון, בהינתן שהערך האמיתי של תוחלת תשובות המפגינים היא 31.5% היא ערך P (P value) – של  1.623788e-05

(הפקודה ב- R לחישוב היא:

dnorm(42.06,31.5, 19.06/sqrt(60))

)

שאלה שניה שנשאלה הייתה "כמה מס הכנסה פדרלי אתם מאמינים שמשלמת משפחה ממוצעת (עם הכנסות של 50000$ לשנה) ?"
ביחידות של 1,000 דולר, התשובות היו:
תשובה ממוצעת: 12.71
סטיית תקן: 12.06
מספר מפגינים שנשאלו: 60
התשובה הנכונה היא (על סמך המקור) 7.5, שזה פחות ממה שהמפגינים ענו בממוצע. השאלה (הסטטיסטית) היא האם אמונת המפגינים לגבי שיעור המס (המוטל על משפחה ממוצעת) היא מוטה כלפי מעלה באופן מובהק.

כמו קודם, החישוב מראה שכן. עם ערך P של: 0.00094
קוד ה- R לחישוב היה:
dnorm(7.5,12.71, 12.06/sqrt(60))

(קישורון לכיף – הנה דוגמא לפוסט שיוסי לוי כתב בזמנו, בו הוא גם השתמש במשפט הגבול המרכזי: "סקר לדוגמא")

אז מה המסקנה?

המסקנה שלי מהסקר היא שאנשים שלא רוצים שיעלו את המיסים בארה"ב, יש תפיסה פסימיסטית לגבי מצב המיסוי הנוכחי בארה"ב.

שאלת המליון היא מהי כיוון הסיבתיות במקרה שלנו. האם התפיסה הפסימיסטית הזו היא זו שמובילה את האנשים להפגין (ולתת כזה יחס עויין לנושא), או שבגלל שלאנשים אלו יש סיבות אידיאולוגיות לוחמניות כנגד מיסוי (לא משנה איזה מיסוי), הם נוטים להגזים במה שהם חושבים שהוא מצב המיסוי הקיים בארה"ב.

אילו האפשרות הראשונה הייתה נכונה – אז ייתכן שמתן המידע המעודכן לגבי המצב המדוייק, הייתה עוזרת. אילו האפשרות השניה היא הנכונה (מה שהוא הניחוש שלי), אז הסיפור הוא אידיאולוגי/מוסרי – והדיון בו ראוי להתקיים במישור הזה.

אגב, כששאלתי את אישתי מה היא מנחשת שהוא אחוז המיסוי בארה"ב, היא ניחשה 25%. (לא רלוונטי, כיוון שאינני בטוח שאפשר להשוות את המדינה ממנה אישתי מגיעה למדינה שממנה הגיעו הנסקרים)
זה היה יכול להיות מעניין לחזור על סקר דומה באוכלוסיה רחבה יותר, ולראות כיצד התפיסה משתנה לפי עמדות פוליטיות.

* * * *
עידכונים בפוסט:
1) אנשים בתגובות תיקנו אותי שהשאלה נשאלה על מס פדרלי שנגבה, ולא "מס" באופן כללי.
2) אנשים שאלו כיצד המספר היחיד ה"נכון" של המס חושב, בהינתן זה שזהו מס שמשתנה בין מדינות. התשובה היא שאינני יודע. אני משער שמדובר במס הרלוונטי במדינה שבה נערך הסקר. הקורא החרוץ מוזמן לעקוב אחר הקישורים שסיפקתי כדי למצוא את הידיעה המקורית ולראות אם הכותב מספק תשובה. בפוסט זה הנחתי שהוא יודע על מה הוא מדבר (ייתכן וטעיתי, אבל לכרגע אני מרשה לעצמי אופטימיות)

* * * *

תגובותיכם יתקבלו בברכה 🙂