FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1784, 292 aa 1>>>pF1KE1784 292 - 292 aa - 292 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.8946+/-0.000788; mu= 17.1202+/- 0.047 mean_var=61.1771+/-12.501, 0's: 0 Z-trim(107.5): 37 B-trim: 0 in 0/50 Lambda= 0.163976 statistics sampled from 9586 (9615) to 9586 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.67), E-opt: 0.2 (0.295), width: 16 Scan time: 2.010 The best scores are: opt bits E(32554) CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 ( 292) 1985 477.9 3.7e-135 CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 ( 295) 952 233.6 1.4e-61 CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 ( 301) 931 228.6 4.4e-60 CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 ( 342) 926 227.5 1.1e-59 CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 ( 230) 781 193.0 1.7e-49 CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 ( 256) 781 193.1 1.8e-49 CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 ( 257) 781 193.1 1.9e-49 CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 ( 216) 733 181.7 4.2e-46 >>CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 (292 aa) initn: 1985 init1: 1985 opt: 1985 Z-score: 2539.9 bits: 477.9 E(32554): 3.7e-135 Smith-Waterman score: 1985; 100.0% identity (100.0% similar) in 292 aa overlap (1-292:1-292) 10 20 30 40 50 60 pF1KE1 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLTIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLTIN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 LAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGIVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 LAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGIVF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 GLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAIVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 GLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAIVD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 PYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTTGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 PYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTTGQ 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 HWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVKHKEQI :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS65 HWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVKHKEQI 250 260 270 280 290 >>CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 (295 aa) initn: 964 init1: 918 opt: 952 Z-score: 1219.2 bits: 233.6 E(32554): 1.4e-61 Smith-Waterman score: 952; 51.6% identity (82.2% similar) in 258 aa overlap (15-272:16-273) 10 20 30 40 50 pF1KE1 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLTI : .. : ...:.: :::.::...::: :::..:::: :: .:: CCDS10 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 NLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGIV :..:..::...: .:: :::.:.::::..:::...: :.:::.:. :: ::::.::. : CCDS10 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 FGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAIV ::.:::.. :: ..:.. : :.:: ::::::. .:.. :.: :: ..: :.. :.:: CCDS10 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 DPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTTG : : .::::: ...::...::..:.:.::: :.:::::..::::::::::: :: .: CCDS10 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 QHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVKHKEQI ...::.:.:.::.:.. : ..: :.: : .: CCDS10 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKTEQSEDKPEKYELSVIM 250 260 270 280 290 >>CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 (301 aa) initn: 978 init1: 918 opt: 931 Z-score: 1192.2 bits: 228.6 E(32554): 4.4e-60 Smith-Waterman score: 931; 50.2% identity (78.9% similar) in 279 aa overlap (14-289:11-284) 10 20 30 40 50 pF1KE1 MGRQKELVSRCGEMLHIRYR--LLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLT : :.: : : :: ::: ::...:... :.:::.: : :.:.:.: CCDS10 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFT 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 INLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGI . :: ..:::..: ..:.::::::::: ..:::...: ::.::::: :.: :.:: ..: CCDS10 MFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 VFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAI .. ::.::. ... ..: :.::. ::.::::::. .:.. :::.:: .::. ::: .::: CCDS10 TYVLYHDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 VDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTT .: :. :: ::: .::...:..: ::: : : .:::::.:::::: .:::: ::.. CCDS10 LDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 GQHWWWVPIVSPLLGSIAGVFVYQLMIGCHL-EQPPPSNEEENVKLAHVKHKEQI :. :::::.:.::.:. .:. .:::... : : : :... :. ..:: CCDS10 GNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQD-----LVSAQHKASELETPA 240 250 260 270 280 290 CCDS10 SAQMLECKL 300 >>CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 (342 aa) initn: 929 init1: 818 opt: 926 Z-score: 1185.0 bits: 227.5 E(32554): 1.1e-59 Smith-Waterman score: 926; 47.2% identity (80.9% similar) in 267 aa overlap (7-273:21-284) 10 20 30 40 pF1KE1 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQV .... :.:. ...:. ::: ..: ....:: ::::.. CCDS65 MVQASGHRRSTRGSKMVSWSVIAKIQEILQ--RKMVREFLAEFMSTYVMMVFGLGSVAHM 10 20 30 40 50 50 60 70 80 90 100 pF1KE1 VLSRGTHGGFLTINLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTL ::.. .:..: .::.:::.::.:. .::..::::.: ::::: : :.: :: :.:.:.: CCDS65 VLNK-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE1 AQTLGAFLGAGIVFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFI .: ::.::.:. ...:.: :: ::. .::.:.:: .:::::::: :. . ::... CCDS65 GQFLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAW 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 GTASLIVCVLAIVDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFT :. : .:..::.: :::. : ::...:..:..::.:.:.:.:::.::.::. ::.:: CCDS65 LTGMLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFT 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 ALAGWGSAVFTTGQHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHV .::::. ::..:..:::::.:.::::. : ..: ..:: . . : CCDS65 FIAGWGKQVFSNGENWWWVPVVAPLLGAYLGGIIYLVFIGSTIPREPLKLEDSVAYEDHG 240 250 260 270 280 290 290 pF1KE1 KHKEQI CCDS65 ITVLPKMGSHEPTISPLTPVSVSPANRSSVHPAPPLHESMALEHF 300 310 320 330 340 >>CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 (230 aa) initn: 792 init1: 768 opt: 781 Z-score: 1002.1 bits: 193.0 E(32554): 1.7e-49 Smith-Waterman score: 781; 52.2% identity (82.1% similar) in 207 aa overlap (66-272:2-208) 40 50 60 70 80 90 pF1KE1 VMFGCGSVAQVVLSRGTHGGFLTINLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAR ::...: .:: :::.:.::::..:::...: CCDS81 MAVAMAIYVAGGVSGGHINPAVSLAMCLFGR 10 20 30 100 110 120 130 140 150 pF1KE1 EPWIKLPIYTLAQTLGAFLGAGIVFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHL :.:::.:. :: ::::.::. :::.:::.. :: ..:.. : :.:: ::::::. .: CCDS81 MKWFKLPFYVGAQFLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYL 40 50 60 70 80 90 160 170 180 190 200 210 pF1KE1 DMINGFFDQFIGTASLIVCVLAIVDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVN .. :.: :: ..: :.. :.:: : : .::::: ...::...::..:.:.::: :.: CCDS81 SLANAFADQVVATMILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMN 100 110 120 130 140 150 220 230 240 250 260 270 pF1KE1 PARDFGPRLFTALAGWGSAVFTTGQHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPS ::::..::::::::::: :: .:...::.:.:.::.:.. : ..: :.: : .: CCDS81 PARDLSPRLFTALAGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSV 160 170 180 190 200 210 280 290 pF1KE1 NEEENVKLAHVKHKEQI CCDS81 FKTEQSEDKPEKYELSVIM 220 230 >>CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 (256 aa) initn: 763 init1: 694 opt: 781 Z-score: 1001.4 bits: 193.1 E(32554): 1.8e-49 Smith-Waterman score: 781; 47.8% identity (81.3% similar) in 230 aa overlap (7-236:20-246) 10 20 30 40 pF1KE1 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQVV .... :.:. ...:. ::: ..: ....:: ::::..: CCDS83 MGSGHCLRSTRGSKMVSWSVIAKIQEILQ--RKMVREFLAEFMSTYVMMVFGLGSVAHMV 10 20 30 40 50 50 60 70 80 90 100 pF1KE1 LSRGTHGGFLTINLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLA :.. .:..: .::.:::.::.:. .::..::::.: ::::: : :.: :: :.:.:.:. CCDS83 LNK-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLG 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE1 QTLGAFLGAGIVFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIG : ::.::.:. ...:.: :: ::. .::.:.:: .:::::::: :. . ::... CCDS83 QFLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWL 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 TASLIVCVLAIVDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTA :. : .:..::.: :::. : ::...:..:..::.:.:.:.:::.::.::. ::.:: CCDS83 TGMLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTF 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 LAGWGSAVFTTGQHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVK .::::. :: CCDS83 IAGWGKQVFRYCPCPGPFL 240 250 >>CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 (257 aa) initn: 763 init1: 694 opt: 781 Z-score: 1001.4 bits: 193.1 E(32554): 1.9e-49 Smith-Waterman score: 781; 47.8% identity (81.3% similar) in 230 aa overlap (7-236:21-247) 10 20 30 40 pF1KE1 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQV .... :.:. ...:. ::: ..: ....:: ::::.. CCDS83 MVQASGHRRSTRGSKMVSWSVIAKIQEILQ--RKMVREFLAEFMSTYVMMVFGLGSVAHM 10 20 30 40 50 50 60 70 80 90 100 pF1KE1 VLSRGTHGGFLTINLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTL ::.. .:..: .::.:::.::.:. .::..::::.: ::::: : :.: :: :.:.:.: CCDS83 VLNK-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVL 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE1 AQTLGAFLGAGIVFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFI .: ::.::.:. ...:.: :: ::. .::.:.:: .:::::::: :. . ::... CCDS83 GQFLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAW 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 GTASLIVCVLAIVDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFT :. : .:..::.: :::. : ::...:..:..::.:.:.:.:::.::.::. ::.:: CCDS83 LTGMLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFT 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 ALAGWGSAVFTTGQHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHV .::::. :: CCDS83 FIAGWGKQVFRYCPCPGPFL 240 250 >>CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 (216 aa) initn: 737 init1: 694 opt: 733 Z-score: 941.1 bits: 181.7 E(32554): 4.2e-46 Smith-Waterman score: 733; 48.4% identity (77.9% similar) in 217 aa overlap (46-258:1-216) 20 30 40 50 60 70 pF1KE1 HIRYRLLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLTINLAFGFAVTLGILIAG .::.. .:..: .::.:::.::.:. .:: CCDS83 MVLNK-KYGSYLGVNLGFGFGVTMGVHVAG 10 20 80 90 100 110 120 130 pF1KE1 QVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGIVFGLYYDAIWHFADNQL ..::::.: ::::: : :.: :: :.:.:.:.: ::.::.:. ...:.: :: ::. .:: CCDS83 RISGAHMNAAVTFANCALGRVPWRKFPVYVLGQFLGSFLAAATIYSLFYTAILHFSGGQL 30 40 50 60 70 80 140 150 160 170 180 190 pF1KE1 FVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAIVDPYNNPVPRGLEAFTV .:.:: .:::::::: :. . ::... :. : .:..::.: :::. : ::... CCDS83 MVTGPVATAGIFATYLPDHMTLWRGFLNEAWLTGMLQLCLFAITDQENNPALPGTEALVI 90 100 110 120 130 140 200 210 220 230 240 250 pF1KE1 GLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFT----TGQHWWWVPIVSPL :..:..::.:.:.:.:::.::.::. ::.:: .::::. :: : :: : .: CCDS83 GILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIAGWGKQVFRWHHLPGLHWLHHPTGAPE 150 160 170 180 190 200 260 270 280 290 pF1KE1 LGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVKHKEQI .:.. :: CCDS83 IGGFCGV 210 292 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 15:47:07 2016 done: Sun Nov 6 15:47:07 2016 Total Scan time: 2.010 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]