Errors in protein structures (original) (raw)

��ࡱ�>�� tv����s��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������'` ���bjbj���� .������4 �������������� 8J$n� =-�^�: : : : : : : h,j,j,j,j,j,j,$).h�0��,i�: : : : : �,��: : �,�$�$�$: ��: �: �'��$: h,�$�$���$: R @��H��"��$(%� -0=-�$1�#�1�$1��$@: : �$: : : : : �,�,f$�: : : =-: : : :   � �$   �   ���������� Supporting Information Supporting Table 1: primers used in this study Cloning primershATP8B1 AscI start5�-ggcgcgccttagtacagaaagagactcagaahATP8B1 stop NheI5�-GCGCGCTAGCTCAGCTGTCCCCGGTGCGCCTGTACTChCDC50A forward5�-hCDC50A reverse5�-L127P forward 5�-ttatatttcctggctcctcttatcttacaggcaL127P reverse5�-TGCCTGTAAGATAAGAGGAGCCAGGAAATATAAG308V forward 5�-accgatttctgccacgtcttagtcatttttgcaG308V reverse5�-TGCAAAAATGACTAAGACGTGGCAGAAATCGGTD454G forward5�-cattatatcttctctggtaagacggggacactcD454G reverse5�-GAGTGTCCCCGTCTTACCAGAGAAGATATAATGD554N forward 5�-caggcagcctctcccaatgaaggtgccctggtaD554N reverse5�-TACCAGGGCACCTTCATTGGGAGAGGCTGCCTGI661T forward5�-ctttgctacaaggaaactgaagaaaaagaatttI661T reverse5�-AAATTCTTTTTCTTCAGTTTCCTTGTAGCAAAGG1040R forward 5�-gtaagcttgttgcatagggtcctaacatcgatgG1040R reverse5�-CATCGATGTTAGGACCCTATGCAACAAGCTTACR1164X forward5�-cccgtcgttgccatttgattcctgtcaatgaccR1164X reverse5�-GGTCATTGACAGGAATCAAATGGCAACGACGGGq-RT-PCR primershypoxanthine-guanine phosphoribosyltransferase (HPRT) forward5�- tgaccttgatttattttgcatacchypoxanthine-guanine phosphoribosyltransferase (HPRT) reverse5�- cgagcaagacgttcagtccthygromycin phosphotransferase forward 5�- aggccgtggttggcttgtathygromycin phosphotransferase reverse5�- gaccaatgcggagcatatacgATP8B1 forward5�-GCATTTTAATTTACAGGCACAGATP8B1 reverse5�-GACGGGTAGTAAGCACACAG Molecular modeling of ATP8B1 The homology model of ATP8B1 was built using the crystal structure of the sarco/endoplasmic reticulum calcium ATPase from Oryctolagus cuniculus as a template (PDB file 2ZBD  ADDIN EN.CITE  ADDIN EN.CITE.DATA o(21), the one with the best WHAT_CHECK results  ADDIN EN.CITE Hooft199629292917Hooft, R. W.Vriend, G.Sander, C.Abola, E. E.Errors in protein structuresNatureNature27238165801996/05/23Crystallography, X-RayDatabases, Factual*Protein ConformationQuality Control1996May 230028-0836 (Print)8692262http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&dopt=Citation&list\_uids=869226210.1038/381272a0eng(1)). The alignment between ATP8B1 and 2ZBD was created with T-Coffee  ADDIN EN.CITE Notredame200030303017Notredame, C.Higgins, D. G.Heringa, J.National Institute for Medical Research, The Ridgeway, London, NW7 1AA, UK. cedric.notredame@europe.comT-Coffee: A novel method for fast and accurate multiple sequence alignmentJ Mol BiolJ Mol Biol205-1730212000/08/31*AlgorithmsAmino Acid MotifsAmino Acid SequenceAnimalsComputational Biology/*methodsDatabases as TopicHumansMolecular Sequence DataProtein-Serine-Threonine Kinases/chemistryReproducibility of ResultsSensitivity and SpecificitySequence Alignment/*methodsSequence Homology, Amino AcidSoftware2000Sep 80022-2836 (Print)10964570http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&dopt=Citation&list\_uids=1096457010.1006/jmbi.2000.4042 S0022-2836(00)94042-7 [pii]<languag�e�>eng(2) as described previously  ADDIN EN.CITE  ADDIN EN.CITE.DATA j(3). Due to the low sequence identity, the alignment around the mutations described here was additionally validated using Phyre  ADDIN EN.CITE Bennett-Lovsey200832323217Bennett-Lovsey, R. M.Herbert, A. D.Sternberg, M. J.Kelley, L. A.Structural Bioinformatics Group, Division of Molecular Biosciences, Imperial College London, London SW7 2AY, United Kingdom.Exploring the extremes of sequence/structure space with ensemble fold recognition in the program PhyreProteinsProteins611-257032007/09/19*AlgorithmsAnimalsDatabases, ProteinHumans*Protein ConformationProtein FoldingProteins/chemistry/metabolismSequence Alignment*Sequence Analysis, Protein*Software2008Feb 151097-0134 (Electronic)17876813http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&dopt=Citation&list\_uids=1787681310.1002/prot.21688eng(4) and mGenThreader  ADDIN EN.CITE Jones199933333317Jones, D. T.Department of Biological Sciences, University of Warwick, Coventry, CV4 7AL, UK. jones@globin.bio.warwick.ac.ukGenTHREADER: an efficient and reliable protein fold recognition method for genomic sequencesJ Mol BiolJ Mol Biol797-81528741999/04/07AlgorithmsAmino Acid Sequence*GenomeMolecular Sequence DataNeural Networks (Computer)Open Reading Frames*Protein Conformation*Protein FoldingReproducibility of ResultsSequence Alignment/*methodsSequence Homology, Amino Acid1999Apr 90022-2836 (Print)10191147http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&dopt=Citation&list\_uids=10191147S0022-2836(99)92583-4 [pii] 10.1006/jmbi.1999.2583eng(5). The actual model was built with YASARA as described  ADDIN EN.CITE  ADDIN EN.CITE.DATA �(3), including the SCWRL side-chain prediction algorithm  ADDIN EN.CITE Canutescu200334343417Canutescu, A. A.Shelenkov, A. A.Dunbrack, R. L., Jr.Institute for Cancer Research, Fox Chase Cancer Center, Philadelphia, Pennsylvania 19111, USA.A graph-theory algorithm for rapid protein side-chain predictionProtein SciProtein Sci2001-141292003/08/22AlgorithmsComputational BiologyComputer SimulationDatabases as TopicDisulfidesModels, MolecularModels, StatisticalMolecular ConformationProtein ConformationProtein Structure, SecondaryProteins/*chemistryProteomics/*methodsSoftware2003Sep0961-8368 (Print)12930999http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&dopt=Citation&list\_uids=12930999eng</languag�e�>(6) and high-resolution refinement  ADDIN EN.CITE Krieger200435353517Krieger, E.Darden, T.Nabuurs, S. B.Finkelstein, A.Vriend, G.Center for Molecular and Biomolecular Informatics, University of Nijmegen, Nijmegen, The Netherlands. elmar.krieger@yasara.orgMaking optimal use of empirical energy functions: force-field parameterization in crystal spaceProteinsProteins678-835742004/09/25*Computer SimulationCrystallography, X-RayModels, MolecularProtein Structure, TertiaryProteins/*chemistryRibonuclease T1/chemistryStructural Homology, Protein*Thermodynamics2004Dec 11097-0134 (Electronic)15390263http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&dopt=Citation&list\_uids=1539026310.1002/prot.20251eng(7). The coordinates are available from the authors upon request. Molecular graphics were created with www.YASARA.org. Supporting References  ADDIN EN.REFLIST 1. Hooft RW, Vriend G, Sander C, Abola EE. Errors in protein structures. Nature 1996;381:272. 2. Notredame C, Higgins DG, Heringa J. T-Coffee: A novel method for fast and accurate multiple sequence alignment. J Mol Biol 2000;302:205-217. 3. El-Sheikh AA, van den Heuvel JJ, Krieger E, Russel FG, Koenderink JB. Functional role of arginine 375 in transmembrane helix 6 of multidrug resistance protein 4 (MRP4/ABCC4). Mol Pharmacol 2008;74:964-971. 4. Bennett-Lovsey RM, Herbert AD, Sternberg MJ, Kelley LA. Exploring the extremes of sequence/structure space with ensemble fold recognition in the program Phyre. Proteins 2008;70:611-625.  "FGHXY[am�����������������   + : = ^ _ o � � � � � � � � � � �  / 0 @ R S �������ȶ��ֶ����ֶ��֧���֧�ֶ��ֶֶֶ��ֶֶֶ��ֶֶֶ�,h�7Ch�Rp;�B*CJOJQJ^JaJph�h�Rp;�CJOJQJ^JaJ#h�7Ch�Rp;�CJOJQJ^JaJhQ"h�Rp5�OJQJ^J h�7Ch�RpCJOJQJ^JaJh�RpCJOJQJ^JaJ h[i5� h�Rp5�8FGHXYZm�������n��zkd$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l $Ifgd�Rpgd�Rpd�gd�Rp ԁ��������{{ $Ifgd�Rpzkdj$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l�����{{ $Ifgd�Rpzkd�$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l�����{{ $Ifgd�Rpzkd>$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l�� + �{{ $Ifgd�Rpzkd�$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l+ , : _ �{{ $Ifgd�Rpzkd$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l_ ` o � �{{ $Ifgd�Rpzkd|$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� � � � �{{ $Ifgd�Rpzkd�$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� � � � �{{ $Ifgd�RpzkdP$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� � 0 �{{ $Ifgd�Rpzkd�$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l0 1 @ e �{{ $Ifgd�Rpzkd$$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�lS e t w � � � � � � � �   $ % 7 G J k l | � � � � � � � � � � " * / G ~ � � � � � � � �  ! # 1 2 K M [ \ s v w ���������������������������ܷܩ�ܷ��ܷ��ܷ��ܷ��ܷܛܷܛܗh�Rph� TCJOJQJ^JaJhQ"h�Rp5�OJQJ^Jh�RpCJOJQJ^JaJ,h�7Ch�Rp;�B*CJOJQJ^JaJph� h�7Ch�RpCJOJQJ^JaJ#h�7Ch�Rp;�CJOJQJ^JaJ:e f t � �{{ $Ifgd�Rpzkd�$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� � � � �{{ $Ifgd�Rpzkd�$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� � �  �{{ $Ifgd�Rpzkdb$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l   7 �{{ $Ifgd�Rpzkd�$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l7 8 G l �{{ $Ifgd�Rpzkd6$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�ll m | � �{{ $Ifgd�Rpzkd�$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� � � � �{{ $Ifgd�Rpzkd $$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� � � � �{{ $Ifgd�Rpzkdt$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� � � � �{{ $Ifgd�Rpzkd�$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� � + H �{{ $Ifgd�RpzkdH$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�lH I � � �{{ $Ifgd�Rpzkd�$$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� � � � �{{ $Ifgd�Rpzkd $$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l� �  " �{{ $Ifgd�Rpzkd� $$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l" # 2 L �{{ $Ifgd�Rpzkd� $$If�F��00 #�0 �O t��0�������#6��������������4�4� la�lL M \ t �{{ $Ifgd�RpzkdZ $$If�F��00 #�0 �O t��0�������#6��������������4�4� la�lt u v w � !;";#;9;:;�pppcaaa ���0�^��`�0�gd�Rp$d�7$8$H$a$gd�Rpgd�Rpzkd� $$If�F��00 #�0 �O t��0�������#6��������������4�4� la�l w � F���������24������VX^`������������$�$�$�$�$�$�+�+�+�+�+�+�+�+,,, ,,z,|,�3�3�3�3�3�3�:�:�:�:!;";#;8;9;:;;;�������������������������������������������������������������������������h[ih[ih�Rp5�h[ih[i5� h�Rp5��h�Rp0J �h�Rpjh�RpU h�Rp6�]�h�Rp h�Rp5�6�I;;M;N;y;<�<�=�ҁӁԁՁׁ؁ځہ݁ށ���������������������h�3�jh�3�Uh��Uh�Rpjh�RpUh�Rph�RpmHsH:;�;<< =�=���сҁԁցׁفځ܁݁߁����������������������� ���0�^��`�0�gd�Rpgd�Rp���;�dh�x^��`�;�gd�Rp5. Jones DT. GenTHREADER: an efficient and reliable protein fold recognition method for genomic sequences. J Mol Biol 1999;287:797-815. 6. Canutescu AA, Shelenkov AA, Dunbrack RL, Jr. A graph-theory algorithm for rapid protein side-chain prediction. Protein Sci 2003;12:2001-2014. 7. Krieger E, Darden T, Nabuurs SB, Finkelstein A, Vriend G. Making optimal use of empirical energy functions: force-field parameterization in crystal space. Proteins 2004;57:678-683.      ,1�h��. ��A!��"��#��$��%����� ��h$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�lh$$If�F!vh5�0 5�O#v0 #vO:V�F t��#6�,�5�0 5�Oa�l��@@��@ �RpNormalCJ_HaJmH sH tHDA@���D Default Paragraph FontRi@���R  Table Normal�4� l4�a� (k���(No List4@�4 �RpHeader  ��B#.)@�. �Rp Page Numberj�@�j �Rp Table Grid7:V�0������H�"H �Rp Balloon TextCJOJQJ^JaJ4 @24 �VUFooter  ���!�4�����FGHXYZm�����������+,:_`o�������� 01@eft������78Glm|�����������+HI������"#2LM\tuvw�00000�0!1�1�273�3�4�4�4�4�4�4�4�4�4�4�4�4�0���0���0���0���0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0��� �0���0���0���0���0���0���0���0���0���0���0���0���0���0���0���0���0��X�00��00�X�00��00�X�00��00�X�00��00���00�FGHXYZm�����������+,:_`o�������� 01@eft������78Glm|���������+HI������"#2LM\tuvw�00�4j�000� @0��00���00�X�0=0>�X�0=0>�X�00 X�00 X�00 X�00�X�00�X�00�X�0 0 X�0D09�X�0D09�X�0 0 X�0F09�X�0F09�X�0 0 X�00' X�0 0 @0�X�00 X�00  X�0 0 X�0 0 X�0 0 ��00�X�00  X�00  X�00  X�00 X�00 @0 X�00  X�00 @0y not X�00 X�00  X�00 X�00  X�00 @0y not X�00 X�00  X�00 X�0 0  X�00 @0y not X�0$0  X�00  @0y not�X�0&0  X�0'0 X�00 X�00 X�00 ��00�Z�0-0 Z�00 ��00�Z�0r0s�Z�000 Z�0t0u�Z�000 Z�000 Z�000 �@0���Z�030 Z�030 �@0���Z�060 Z�060 �@0���Z�090 Z�090 �@0��*�Z�0�0��Z�0�0� @0�Z�0�0�Z�0�0� @0���00�h�00�@0�j�00��@0������ S w ;;�,=>����+ _ � � � 0 e � �  7 l � � � � H � � " L t :;� "#$%&'()*+-./0123456789:;<?�!AQghm�� � � +/IYopt�����!�!�!�!�!�!�!""�(�(�(�/�/020�4�4QQ�D���Q���Q���QQ�@���Q���Q���QQ�@���Q���Q���Q��� "((bf��^w����������#Yp�����!�!00J0P0T0Y0Z0\0�0�0�0�0 11$1-1A1C1E1L1P1V1W1Y1[1e1f1h1}1�1�1�1�1�1�1�1�12�2�2�2�2 3$3:3C3H3Q3V3^3�3�3�3�3�34�4�4�4�4�4�4�4�4�4�4�4�4�4�43060^0{0�0�0j1�1�1�1-2�2�2�2�2�2)313g3�3�3�3s4z4�4�4�4�4�4�4�4�4�4�4�4�4�433333333333 "((H�P Ypw�!�!�"�/00f4�4�4�4�4�4�4�4�4�4�4�4�4�4�4 "((00�4�4�4�4�4�4�4�4�4�4�4�4�4 � j[i�W� T�VU�:b�Rp�3���eQ�HXYZm�����������+,:_`o�������� 01@eft������78Glm|�����������+HI������"#2LM\tu�"�4���������������������������90��EN.InstantFormat0�H EN.Layout�H EN.Libraries$�Hw111V{}Times New Roman121072000MVandegraaf.enl�@00�#?00d�!�"�2�40@00 @00<@0,0\@0@��Unknown������������G��: �Times New Roman5��Symbol3&� �: �Arial5& �za��Tahoma"1�������F�Jڦ��,_��,_!�������4i4i42�q�HX ��?�����������������������Rp2��Supplementary InformationStan van de GraafJMarcy�������Oh��+'��0�������� , L X dpx���Supplementary InformationStan van de Graaf Normal.dotJMarcy4Microsoft Office Word@�Ik@�t_�j�@&V �H���,����՜.��+,��0 hp���� ���� � �� UMC Utrecht_i4' Supplementary Information Title  !"#$%&'()*+,-./0123456789:;<=>?@A����CDEFGHI����KLMNOPQRSTUVWXYZ[\]^_`ab����defghij����lmnopqr��������u��������������������������������������������Root Entry�������� �F0l%�H�w�Data ������������B1Table����J1WordDocument����.�SummaryInformation(������������cDocumentSummaryInformation8��������kCompObj������������q������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������ ���� �FMicrosoft Office Word Document MSWordDocWord.Document.8�9�q