読者です 読者をやめる 読者になる 読者になる

HTML5の<br>と<br />

HTML5の解説本にどっちでもいいと書いてあった覚えがあるけど、巷のサイトでは混乱しているので仕様書に当たる。結果、「スラッシュは入れてもいいけど何の効果もないよ」という文を発見。よかった、小生の記憶は間違ってなかった。

if the element is one of the void elements, (省略) then there may be a single U+002F SOLIDUS character (/). This character has no effect on void elements,

https://www.w3.org/TR/html51/syntax.html#ref-for-void-elements-6

ちなみに、終了タグがないのはこいつら(void elements)だ。imgとかhrとかは常識的にわかるけど、inputもない。


XHTML。しかし、XHTMLなんぞは失敗した過去の遺物であり、仕様書を調べるのが面倒くさいので英語版ウィキペディアから。

Note that any of these is acceptable in XHTML: <br></br>, <br/>, and <br />. Older HTML-only browsers interpreting it as HTML will generally accept <br> and <br />.

https://en.wikipedia.org/wiki/XHTML#Common_errors
  • <br></br>
  • <br/>
  • <br />

以上の書き方はみんな正しい。でも古いブラウザ(当時)は <br/> を理解できないことがある。

結論

  • HTML5なら<br>
    • ただし<br />と書いてもよい
  • XHTMLなら<br/>
    • ただし前方互換を意識して<br />にしてもよい

TwitterとEvernoteの違和感

TwitterEvernoteはもうだめかもしれないなって思うことがある。

別に特段の理由があるわけではないのだが、なんか使ってて「違和感」を覚えるのだ。

具体的にダメな点なら指摘できる。例えば、Twitterなら検索機能が何年も使いにくいままだとか、不良ユーザーが野放しになってるとか。Evernoteならクライアントのバグが何年も放置されてるとか、ウェブ版の使い勝手が悪いとか。

でも、これらが直接的な原因なのではない。何となく使ってて「いやー」な感じがするのだ。運営にやる気がないのではないか、開発者がこっちを向いてないのではないか、そう思うことがよくある。もし小生が株をやってたら絶対に売ってると思う。

まぁ、終わった終わったと言われ続けた2chにもなんだかんだで続いているし、潰れることはないだろうけど。それに、今現在、使っているのだから潰れてもらったら困る。ただ将来的に何か別のものに乗り換えるのではないか、そんな予感がした。

ごく初歩的な方法でPythonからPowerShellにデータ渡す

Channel 9 というサイトを見つけたので、いくつか動画を見てみたのだが、Windowsの最新テクノロジーに関する動画もあれば、こんな身近な話題もある。

channel9.msdn.com

上での動画で説明しているのは基本的なことで、
例えばPowerShellスクリプトPythonのコードを埋め込むときはヒアドキュメントにする。

py -c @'
print('hello world')
print('日本語')
'@

Pythonから構造のあるデータを返すときはJSONにして返す。

# 一旦aに受ける
$a = py -c @'
import json
data = [
  {'name' : 'nextugi', 'job' : 'neet'},
  {'name' : 'yamada', 'height' : 170},
]
print(json.dumps(data))
'@ | ConvertFrom-Json

# nameを取り出す
$a.name

こんな感じ。別にPythonに限った話ではなく、他のスクリプト言語やコンソールコマンドでも同じだね。

VisualStudioの件もあるし、そのうちPowerShellの中にPythonを組み込む方法が出てくるかもね。

Python3.6からWinでもファイルステムがUTF-8化した

Python3.6からWindowsでもstdoutなどがUTF-8化してた。sys.getfilesystemencoding() とか sys.stdout.encoding とかも UTF-8 を返す。まるで OS が UTF-8 化したかのようだな。

どういうことかというと、文字列をコンソールに出力したとする。そうすると、まずPythonの文字列をUTF-8に変換する。それからOSの手前当たりで UTF-16LE に変換する。それから Windows API の *W系関数を使って文字列を画面に表示する。こんな感じ。

これまでsys.stdout.bufferにバイナリを入力できて、とても見通しがよかったのだが。う~ん、これでいいのかなあ。確かにWindows自体は全てがUTF-16化されてるわけだし、*W系の関数を使うべきだけど。それならそれでPythonの方も UTF-16 にしておくべきでは? まぁ、今回の件に関するPEPとかよく読んでないから、この不満は見当違いかもしれないけど。

あ、そうだ、 locale.getpreferredencoding() は相変わらず cp932 なので、open関数で encoding を省略すると、旧来の文字コードになるのは一緒です。はい。

それにしてもWindowsがコードページの概念から開放されるのはいつになるんでしょう。10年後ぐらい? 旧式のWindows APIもなくなると言われてもう15年くらいたつけど依然として残ってるし、Component Object Model も滅びずにロストテクノロジー化してるわけで、そう考えるとWindowsは新しいようで結構古い。

最近、Windows Subsystem for Linux をちょっと触ってみたんですけど、結構デキがよろしいように見える。10年後にはWindowsMacと同じようにUNIX化してたりしてね。

ReadyBoostが意外と効く

手元の余ってるUSBメモリーをReadyBoost用にしてみたら意外と効いた。特にOSの起動にかかる時間が4割くらい減ったような気がする。

このパソコン、CPUは4コアで計算能力は足りてるのだが、HDDが古い上にSATA2.0なので、データの読み込み速度が足を引っ張ってるよう見える。タスクマネージャーでもHDDは起動直後100%になってるし。そこでReadyBoostを試してみたところいい感じ。古いPCを使ってるのなら試してみることをすすめる。

ちなみに、USBメモリーは手元に余ってるやつの中からCheck Flashで速度を測ってから選んだのだが、種類によってかなり速度差がある。古くても早かったり、新しくても遅かったりすることもあった。

一寸の虫にも五分の魂

「一寸の虫にも五分の魂」の「五分」とはどういう意味なのか。

ググッても出てこないんだけど、皆は疑問に思わないの? そうですか。

仮説①

分とは割分厘の分のことである。

→ すなわち「人間の5%くらいの魂があるよ」という意味である。

仮説②

分とは10分の1のことである。

→ すなわち「人間の10%くらいの魂があるよ」という意味である。

仮説③

分とは尺貫法における質量の単位である。

→ すなわち「約375ミリグラムの魂があるよ」という意味である。

仮説④

五分とは「ほんのわずか」という意味である。

→ すなわち「わずかな魂があるよ」という意味である。

仮説⑤

五分とは等しいという意味である。

→ すなわち「体の大きさに見合った魂があるよ」という意味である。

結局どれ?

わかりません。

ひょっとしたら③~⑤あたりを合わせた意味があるんのではないかと思う。

Adblockはウェブを次の段階に引き上げるか?

Adblockのヒット数カウント機能がうまく動いてなくて、時々ググって何か情報がないか探しているのだが未だに解決しない。 [*1]

それで、検索結果に以下のようなサイトが混じっていて気付いたんだけど、Adblockに怒ってる人って結構いるのね。裁判沙汰とかに発展してたりして。

確かに、皆が広告ブロックを使い始めたら、広告に依存した今のネットは立ち行かなくなるかもしれないね。

でもよく考えると、これって僕にとっては望ましいことなんじゃないかなって、ふと思った。というのも自分は、まだSEOとかアフィリエイトとかが幅を利かせていなかった頃のネットが好きだから。当時の人間には金銭的報酬なんか一切なかったけど、ブログを書いたりサイトを作ったりしてた。そしてそういう情報しかなかったから、ネットは今より精神衛生上よかった。

それに広告がなくなってもたぶんネットは潰れない。大手のウェブサービスもたぶんなくならない。でもお金はちゃんと取るようになるかな。それでいいと思う。きちんと利用者から対価を取るネットの方が僕らのためになる。あの手この手で人を引きつけて無理やり情報を食わせようする今のネットは好きじゃない。

そういう時代になっても広告は残るかもしれないけど、基本的に閲覧者のためになるものしか残らない。ユーザーを騙したり煽ったりするものはそもそも見てくれないので自然と消えていってしまうだろう。class属性やid属性を消したくらいで広告フィルタリングの波を止めることはできない。AI技術の発展により広告っぽい要素は機械的に判定可能なようになる。ここ数年の技術レベルを見ていると明日そういうニュースが流れる可能性すらある。一時期に比べてSPAMメールがほとんど問題にならなくなったように、広告まみれのウェブが見れるのは、おそらくこの時代が最後なのかもしれないね。


というのが僕の予想なんだけど、こうした話がどこまで信用できるのか、それはわからん。というのも2000年初め頃の予想も結構外れてたりするから。当時は、ネットがあれば未来は明るいって思われてた。ネットがあれば人々は賢くなるし、相互理解の助けになるものと期待されていた [*2]。現在のネットはこの真逆で、ネットには無知が蔓延り、相互理解は進まず憎悪を撒き散らしてる。だから、この予想ももしかしたら外れなものかもしれない。 [*3]

*1:こういう記事を書くと、自分は広告をブロックしまくっていると思われそうだが、実はリスト購読などは一切してなかったりする。じゃあ何のために使っているのかというと、画面の邪魔な要素を消すために使っている。具体的には、窓の杜の記事をスクロールするたびに、目の端にちらちら出てくるボタンを消したり、あるいは書籍サイトで、これから本を評価しようってのに、みんなの評価を見せつけてくるサイトを何とかしたりするために使っている。もちろん、広告もたまにはブロックしてる。画面の1/4を半透明の枠で覆ってしまう広告とか、あまりにも酷いものは手動でルールを作成している。

*2:当時の空気がわかる言葉に「サイバースペース独立宣言」というものがある。今から考えると「おまえは何を言っているんだ」状態である。

*3:未来のウェブはプログラムの吐き出すゴミだらけになっていて、匿名に近い個人サイトとかブログはもはやボットと区別がつかないようになってたりしてね。